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lich beschrieben. Die dort beschriebenen Arbeitsmethoden warden durch Bezugnahme zum Gegenstand 
der Offenbarung der vorliegenden Anmeldung gemacht 

Weiterhin besitzt das erfindungsgemSOe Virus eine magnesiumabhangige Reverse Trariskriptase, die 
aber nicht manganabhSngig ist. Dies steltt eine weitere Gemeinsamkeit zu den Viren HiV-1 und HIV-2 dar. 

5 Zum besseren VerstSndnis der Unterschiede des erfindungsgemaSen MVP-51 80791 Virus zu den 
Retroviren HIV-1 und HIV-2 soil zun&chst kurz der Aufbau der ImmunschwSch verursachenden Retroviren 
erlautert werden. im Inneren des Virus befindet sich die RNA in einem kegelformigen Core, das aus 
Proteinuntereinheiten zusammengesetzt ist, die die Bezeichnung p 24 (p fOr Protein) tragen. Dieses innere 
Core wird von einer Proteinhulle umgeben, die aus dem Protein p 17 aufgebaut ist (auSeres Core) und von 

w einer GlykoproteinhDIle umgeben ist. die neben Lipiden, die aus der Wirtszelle stammer*, das Transmem- 
branprotein gp 41, und das HUllprotein 120 (gp 120) enthalt Dieses gp 120 kann dann mit den CD-4- 
Rezeptoren der Wirtszellen eine Bindung eingehen. 

Soweit bekannt, weist die RNA der HIV-Viren - vereinfacht dargestellt - folgende Genbereiche auf: An 
den beiden Enden sogenannte long terminal repeats (LTR), und die folgenden Genbereiche gag, pol, env 

ts und net Das Gen gag codiert unter anderem fOr die Kem(Core)-Proteine. p 24 und p 17, das Gen pol 
codiert u.a. fUr die Reverse Trariskriptase, die RNAse H und die Integrase und das Gen env codiert fur die 
Glykoproteine gp 41 und gp 120 der VirushUlle. Das Gen nef codiert fUr ein Protein mit Regulatorfunktion. 
Eine schematische Anordnung des Genomes von Retroviren des HIV-Typs ist in Figur 1 gezeigt 

Eine Unterschetdung zwischen den Retroviren HIV-1 und HIV-2 ist u.a. dadurch moglich, dafi virales 

20 Antigen ausgetestet wird mit einem monoklonalen Antikb*rper. der kommerziell ate— Testktt von Abbott 
(HIVAG-1 MonoclonaJ) erhSitlich ist und gegen das (HIV-1) p 24 gerichtet ist Es ist bekannt, daB der Gehalt 
an Reverser Trariskriptase in den Virustypen HIV-1 und HIV-2 etwa gleich ist Wenn man deshalb in 
VerdUnnungen der aufgeschlossenen Viren die Extinktion (E 490 nm), erhalten durch die Antigen-Antkor- 
per-Reaktion, auftragt gegen die Aktivitat der Reversen Transkriptase, dann erhStt man eine Graphik, die 

25 etwa der Figur 2 entspricht Hierbei steltt man test daB im Verhattnis zu dem Gehalt an Reverser 
Transkriptase bei HIV-1 eine sehr hone Bindungsaffinitat fur p 24 mit dem eingesetzten monoklonalen 
Antikorper vorhanden ist FUr HIV-2 tritt dagegen nur eine sehr geringe Bindungsaffinitat fOr p 24 bei 
Einsatz des monoklonalen AntikoVpers wiederum bezogen auf den Gehalt an Reverser Transkriptase auf. 
Werden diese Messungen durchgefUhrt fUr MVP-51 80791, dann befindet sich die Kurve ziemlich genau in 

30 der Mitte zwischen der Kurve von HIV-1 und HIV-2, d.h. die Bindungsaffinitat des monoklonalen Antikttrpers 
gegen MVP-51 80/91 p 24 ist gegenUber HIV-1 reduziert. Figur 2 zeigt schematisch diesen Sachverhalt, 
wobei RT Reverse Transkriptase bedeutet und als Antigen (Ag) das Protein p 24 eingesetzt wird, gegen das 
der monoklonale AntikSrper, der in dem von Abbott kSuflich erwerblichen Testkit vorhanden ist, gerichtet ist. 
Ein sehr vielseitig verwendbares System der Gentechnologie ist die sogenannte PCR (polymerase 

36 chain reaction) geworden, wobei die zur DurchfOhrung des Verfahrens benfitigten Komponenten kSuflich 
erworben werden kSnnen. Mit dtesem Verfahren ist es mdglich, DNA-Sequenzen zu amplrfizteren, wenn 
DNA-Bereiche der zu amplifizierenden Sequenz bekannt sind. Es mUssen dann kurze komplementare DNA- 
Fragmente (Oligonucleotide = Primer) synthetisiert werden, die sich an einen kurzen Bereich der zu 
amplifizierenden NukleinsSuresequenz anlagern. FUr die TestdurchfUhrung werden HIV-NukleinsSuren mit 

40 den Primern zusammengebracht in einer Reaktionsmischung, die zusatzlich eine Polymerase und Nukleo- 
tidtriphosphate enthSlt. Die Polymerisation (DNA-Synthese) wird fur eine bestimmte Zeit durchgefuhrt und 
dann werden die Nukleinsaurestrange durch Erwarmen getrennt. Nach Abkuhlen lauft dann die Polymerisa- 
tion emeut an. Wenn es sich also bei dem erfindungsgemaflen Retrovirus um ein HIV-1 oder HIV-2 Virus 
handelt, dann muflte die NukleinsSure amplifiziert werden kSnnen, indem Primer verwendet werden, die 

45 konserviert sind innerhalb der bekannten Sequenzen der Viren HIV-1 und HIV-2. Derartige Primer sind zum 
Teil vorbeschrieben (Laure\ F. et a!.. Lancet ii. (1988) 538-541 fOr pol 3 und pol 4 bzw. Ou C.Y. et al., 
Science 239 (1988) 295*297 fur sk 38*9, sk 68/69). 

Es wurde nun herausgefunden, daB bei Verwendung von bestimmten Primerpaaren, die folgende 
Sequenz aufweisen: 

50 



55 
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(Seq. ID No. 1-14) 
HIV-1 



gaga: CTACT AGTAC CCTTC AGG 

gagb: CGGTC XACAT AGTCT CTAAA G 

sk38: CCACC TATCC CAGTA GGAGA A 

sk39: CCTTT GGTCC TTGTC TTATG TCCAG AATGC Oder 



pol3: TGGGA AGXTC AATTA GGAAT ACCAC 
pol4: CCTAC ATAGA AATCA TCCAT GTATT G 

pol3n: TGGAT GTGGG TGATG CATA * — 

po!4n: AGCAC ATTGT ACTGA TATCT A SOVie 



SK145: AGTGG GGGGA CATGA AGCAG CC 

SK150: TGCTA TGTCA CTTCC CCTTG GT 

145-P: CCAIG CAAAT GTTAA AAGAG AC 

150-P: GGCCT GGTGC AATAG GCCC 



35 oder sine Kombination von pol3 und pol4 mit 

UNI-1: GTGCT TCCAC AGGGA TGGAA 
^ UNI -2: ATCAT CCATG TATTG ATA 

. (Donehower L A. et al. (1990) J. Virol. Methods 28, 33-46) 
und mit der PCR mit nested primer schwache Amplifikate dor MVP-51 80/91 -DNA erhalten wurden. 

Keine oder nur schwache Amplifikate im Vergleich zum HIV-1, die evtl. auf Verunreinigungen zurOckzu- 
45 fQhren sind, wurden erhalten mit folgenden Primer-Sequenzen: 



50 
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(Seq. ID No. 15-34) 

tat 1 AATGG AGCCA GTAGA TCCTA 
5 tat 2 TGTCT CCGCT TCTTC CTGCC 

tat IP GAGCC CTGGA AGCAT CCAGG 
, 0 tat 2P GGAGA TGCCT AAGGC TTTTG 



75 



20 



25 



36 



45 



enva: TGTTC CTTGG GTTCT TG 
envb: GAGTT TTCCA GAGCA ACCCC 
sk68: AGCAG CAGGA AGCAC TATGG 
sk69: GCCCC AGACT GTGAG TTGCA ACAG 

5v3e: GCACA GTACA AXGTA CACAT GG 

3v3e: CAGTA GAAAA ATTCC CCTCC AC 

5v3degi: TCAGG ATCCA TGGGC AGTCT AGCAG AAGAA G 

3v3degi: ATGCT CGAGA ACTGC AGCAT CGATT CTGGG TCCCC TCCTG AG 

3v31ongdegi: CGAGA ACTGC AGCAT CGATG CTGCT CCCAA GAACC CAAGG 

3v31ongeXt: GGAGC TGCTT GATGC CCCAG A 

gagdi: TGATG ACAGC ATGTC AGGGA GT 
pol e: GCTGA CATTT ATCAC AGCTG GCTAC 

1m Vergleich zum HiV-1 schwache Amplifikate, die jedoch die gleiche Intensitait wie das verwendete HIV-2 
Isolat (MVP-11 971/87) aufwiesen, wurden erhalten mit 

gag c: TATCA CCTAG AACTT TAAAT GCATG GG 
gag d: AGTCC CTGAC ATGCT GTCAT CA 
env c: GTGGA GGGGA ATTTT TCTAC TG 
env d: CCTGC TGCTC CCAAG AACCC AAGG. 



Eine weitverbreitete Methode zum Nachweis von HIV-Antikorpern ist der sogenannte Western Blot 
(Immunoblot). Dabei werden die viralen Proteins gelelektrophoretisch aufgetrennt und dann auf eine 
Membran tiberfUhrt Die mit den QberfUhrten Proteinen versehenen Membranen werden dann mit Seren der 

so zu untersuchenden Patienten in Verbindung gebracht. Sofern Antikdrper gegen die viralen Proteine 
vorhanden sind, binden diese an die Proteine. Nach Waschen verbleiben lediglich spezifische Antikorper 
gegen virale Proteine. Die Antikorper werden dann mit Antiantikdrpern sichtbar gemacht, die regelmaBig mit 
einem Enzym gekoppett sind, das eine Farbreaktion katalysiert. Auf diese Weise kSnnen die Banden der 
viralen Proteine sichtbar gemacht werden. 

55 Das erfindungsgemaBe Virus MVP-51 80/91 weist gegenOber den Viren HIV-1 und HIV-2 im Western 
Blot zwei signrfikante wesentliche Unterschiede auf. Das HIV-1 zeigt regelmMfiig eine starke Bande, die dem 
Protein p 24 zuzuordnen ist und eine sehr schwache, oft kaum sichtbare Bande, die dem Protein p 23 
zuzuordnen ist. HIV-2 weist eine krSftige Bande auf, die dem Protein p 25 zuzuordnen ist und manchmal 
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ein schwache Bande, die dem Protein p 23 zuzuordnen 1st. Im Unterschied dazu weist das erfindungsge- 
ma*6e MVP-51 80/91 Virus zwei etwa gleich starke Banden auf, die den Proteinen p 24 und p 25 
entsprechen. 

Ein weiterer signitikanter Unterschied besteht bei den Banden, di dec Reversen Transkriptase zuzuord- 

5 nen sind. HIV-1 zeigt eine Bande (p 53), die der Reversen Transkriptase entspricht und eine Bande (p 66), 
die der Reversen Transkriptase verbunden mit der RNAse H entspricht Bei HIV-2 entspricht die Reverse 
Transkriptase dem Protein p 55 und, wenn sie mit der RNAse H verbunden ist, dem Protein p 68. Das 
erfindungsgemSBe MPV-51 80/91 weist dagegen eine Bande auf bei dem Protein p 48, die der Reversen 
Transkriptase entspricht, und eine Bande, bei dem Protein p 60, die der Reversen Transkriptase in 

w Verbindung mit RNAse H entspricht. 

Aus diesen Ergebnissen kann geschlossen warden, dafi die Reverse Transkriptase des MVP-51 80791 
ein Molekulargewicht hat. das zwischen etwa 3 und etwa 7 Kilodalton kleiner ist als das der Reversen 
Transkriptase von HIV-1 bzw. HIV-2. Die Reverse Transkriptase von MPV-51 80 weist also ein Molekularge- 
wicht auf, das zwischen etwa 4.500 Daiton und etwa 5.500 Dalton kleiner ist als die Reverse Transkriptase 

is von HIV-1 bzw. HIV-2. 

Es wurde herausgefunden, dafl mit Hilfe des erfindungsgemaBen Virus MVP-51 8079 1 anti-env-AntikSr- 
per in Seren von deutschen Patierrten, die Zeichen von Immunschwa'che zetgen, nur schwach nachgewie- 
sen werden konnen, wobei die Seren aber stark reagieren, wenn anstelle des erfindungsgemaBen Virus ein 
HIV-1 Virus verwendet wird. Diese starkere Nachweisreaktion wurde vor allem lokalisiert in dem gp 41 

20 Protein. Bei den Versuchen wurden Serumpanels gegenQbergestellt die einmal von deutschen Patienten 
starnmen und zum anderen von afrikanischen Patienten mit Zeichen von Immunschwa'che stammen. 

Die oben angegebenen Charakteristika kennzeichnen solche Virus-Varianten, die dem erfindungsgemS- 
Ben MVP-51 80791 entsprechen. Wenn also aus heparinisiertem Spenderblut das von Personen stammt die 
ImmunschwScheanzeichen aufweisen und vorzugsweise aus Afrika stammen, Immunschw&cheviren isoliert 

25 werden, dann kann auf diese Weise das erfindungsgemaee Virus Oder Varianten davon erhalten werden. 

Da das Virus isoliert wurde, welches die oben erw^hnten Eigenschaften aufweist kann die Klonierung 
einer cDNA auf folgendem Weg durchgefOhrt werden: Das Virus wird aus einer entsprechend groBen 
Kulturmenge (etwa 1 I) prazipitiert und in phosphatgepufferter KochsalzJo*sung aufgenommen. Dann erfolgt 
eine Pelletierung durch ein (20 %iges) Saccharose-Kissen. Das Vtruspeltet kann in 6 M Guantdiniumchiorid 

30 in 20 mM Dithiothreitol und 0,5 % Nonidet P 40 suspendiert werden. CsCt wird bis auf eine Konzentration 
von 2 molar zugegeben und die das aufgebrochene Virus enthattende Lttsung wird auf ein CSsiumchlorid- 
Kissen aufgebracht. Dann wird die virale RNA durch Zentrifugation pelletiert, gelSst, mit Phenol extrahiert 
und mit Ethanol und Lithiumchlorid prSzipitiert. Mit Hilfe eines Oligo(dT>Primers wird die Synthese des 
ersten cDNA-Stranges an der viralen RNA oder Teilen davon durchgefOhrt. Die Synthese unter Zugabe von 

35 Reverser Transkriptase kann durchgefOhrt werden unter Verwendung eines kSufltch erhSftlichen Kits. FQr 
die Synthese des zweiten Stranges wird der RNA-Strang des RNA/DNA-Hybrids mit RNase H verdant und 
der zweite Strang unter Einsatz von E.coli DNA Polymerase I synthetisiert. Mit Hilfe von T4 DNA 
Polymerase ktinnen dann stumpfe Enden erzeugt werden und diese mit geeigneten Linkern fUr Restriktions- 
schnittstellen verbunden werden. Nach Restriktionsverdau mit der geeigneten Restriktionsendonuklease wird 

40 das cDNA-Fragment aus einem Agarosegel isoliert und mit einem vomer in geeigneter Weise geschnittenen 
Vektor ligiert. Der Vektor mit dem cDNA-Insert kann dann zur Transformation von kompetenten E.coli-Zellen 
verwendet werden. Die erhaltenen Kotonien werden dann auf Membranen ubertragen, lystert und denaturiert 
und schlieBlich durch Hybridisierung mit Digoxigenin oder Biotin markierter Nukieins£ure aufgefunden. Nach 
gentechnologischer Herstellung der entsprechenden cDNA ist eine Isolierung der gewiinschten DNA* 

45 Fragments, die aus dem Retrovirus stammen, miiglich. Durch Einbau dieser Fragmente in geeignete 
Expressionsvektoren kann dann das gewiinschte Protein bzw. Proteinfragment exprimiert werden und fQr 
die dtagnostischen Tests eingesetzt werden. 

Altemativ zu der angegebenen Methode kann das Immunschwachevirus mit Hilfe der PCR-Technologie 
kloniert werden, wobei die oben angegebenen Primer Verwendung finden konnen. 

50 Zwischen verschiedenen Virusisolaten kann die Ahnlichkeit ausgedrUckt werden durch den Grad der 
Homologie der Nucleinsaure- oder Proteinsequenzen. Eine 50 %ige Homologie bedeutet beispieisweise, 
dafl 50 von 100 Nucleotid- Oder Aminosswre-Positionen in den Sequenzen ubereinstimmen. Die Homologie 
von Proteinen wird durch Sequenzanalyse bestimmt. Homologe DNA- Sequenzen lassen sich auch durch die 
Hybridisierungs-Technik ermitteln. 

55 ErfindungsgemaB wurde zunachst ein Teil aus dem Hullprotein sequenziert und festgestellt, daB diese 
Sequenz nur eine verhiirtnism&Big geringe Homologie zu den entsprechenden Sequenzen von Viren vom 
HIV-Typ aufweist. tnsbesondere bezogen auf den gp 41-Bereich wurde durch einen Vergleich mit HIV- 
Sequenzen, der mit Hilfe von Datenbanken durchgefOhrt wurde, eine Homologie von hochstens 66 % 
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(Nucleotidsequenz) ermittett. 

Es wurde weiterhin der Bereich sequenziert, der ftlr gp 41 kodiert. Diesa Sequenz ist in Tabellen 1 bzw. 
3 dargesteltt. 

Gegenstand der voriiegenden Erfindung sind daher solche Viren, die eine Homologie von mehr als 66 
%, bevorzugt 75 % und besonders bevorzugt 85 % aufwelsen zu dem erfindungsgemaflen HlV-Vlrus, MVP 
5180/91, bezogen auf die Nucleotidsequenz der Tabelle 1 und/oder der Tabelle 3. 

Weiterhin sind Gegenstand der voriiegenden Erfindung solche Viren, die eine Homologie von mehr als 
66 %, bevorzugt 75 % und besonders bevorzugt 85 % aufweisen zu Partialsequenzen der in Tabelle 3 
dargesteltten Nucleotidsequenz. die wenigstens 50, bevorzugt 100 Nucleotide lang sind. Dies entspricht 
einer Lange der Peptide von wenigstens 18 und bevorzugt von wenigstens 33 Aminosauren. 

Das erfindungsgemase Virus unterscheidet sich durch seine Sequenz von vorbekannten Viren. Gegen- 
stand der voriiegenden Erfindung sind daher solche Viren sowie entsprechende DNS- bzw. Aminosa\irese- 
quenzen, die der Sequenz des erfindungsgemasen Virus weitgehend entsprechen. wobei der Grad der 
Abweichung durch den Grad der Homologie festgelegt wird. Eine Homologie von beispieisweise mehr als 
85 % bedeutet daher, daB solche Sequenzen umfaBt werden, die in wenigstens 85 von 100 Nucleotiden 
bzw. Aminosauren dieselben Nucleotide bzw. Aminosauren aufweisen. wahrend der Rest unterschiedlich 
sein kann. Bei der Feststellung der Homologie werden die beiden Sequenzen derart gegenUbergestellt. dafl 
miJglichst viele einander entsprechende Nucleotide bzw. Aminosauren miteinander zur Deckung kommen. 

Die (nahezu) vollstSndige Sequenz, angegeben als DNS-Sequenz des erfindungsgemasen Virus ist in 
Fig. 4 wiedergegeben. Gegenstand der voriiegenden Erfindung sind dabei Viren. die-die Sequenz gem&B 
Fig. 4 aufweisen sowte Varianten davon, die eine hone Homologie zu der Sequenz von Fig. 4 aufweisen 
sowie davon abgeleitete Proteine, Polypeptide und Oligopeptide, die diagnostlsch verwendbar Oder als 
Impfstoff einsetzbar sind. 

Anhand der isolierten Sequenz k6nnen immundominante Epitope (Peptide) konfektioniert und syntheti- 
siert werden. Da die NucleinsSuresequenz des Virus bekannt ist kann der Fachmann hieraus die AminosSu- 
resequenz ableiten. Bn Teilbereich der Aminosauresequenz ist in Tabelle 3 angegeben. Gegenstand der 
voriiegenden Erfindung sind daher auch Antigene. d.h. Proteine, Oligo- Oder Polypeptide, die mit Hirfe der 
in Figur 4 bzw. Tabelle 3 offenbarten Information hergestellt werden kfinnen. Diese Antigene, Proteine. 
Polypeptide und Oligopeptide weisen AminosSuresequenzen auf, die von Figur 4 abgeleitet werden kSnnen 
bzw. in Tabelle 3 angegeben sind. Die Antigene bzw. Peptide kfinnen verhaitnismaGig kurze Teilsequenzen 
einer Aminosauresequenz aufweisen, die in Tabelle 3 wiedergegeben ist oder aus Figur 4 abgeleitet werden 
kann. Diese AminosSuresequenz ist wenigstens 6 Aminosauren, bevorzugt wenigstens 10 und besonders 
bevorzugt wenigstens 15 Aminosauren lang. Hergestellt werden kflnnen diese Peptide nicht nur mit Hilfe 
der rekombinanten Technologie sondem auch durch synthetische Methoden. Bn geeigneter Herstellungs- 
weg ist die Festphasensynthese vom Merrifield-Typ. Eine weitere Beschreibung dieser Technik und anderer 
im Stand der Technik bekannter Verfahren kann in der Literatur gefunden werden, z.B. M. Bodansky, et al., 
Peptide Synthesis, John Weeley & Sons, 2nd Edition 1976. 

Bei den diagnostischen Tests wird eine Serumprobe der zu untersuchenden Person zusammengebracht 
mit den Proteinketten von einem oder mehreren Proteinen oder Glykoproteinen (die in eukaryontischen 
Zeilinien exprimiert werden konnen) oder Teilen davon, die von MVP-51 80/91 stammen. Bevorzugte 
Testverfahren schlieflen die Immunfluoreszenz oder immunenzymatische Testverfahren (z.B. Elisa. Immuno- 
blot) ein. 

Bei den immunenzymatischen Tests (ELISA) kann beispieisweise Antigen, das von MVP-51 80/91 oder 
einer Variante davon stammt, an den WSnden von Mikrotiterplatten gebunden werden. Die dabei verwende- 
te Dosierung hangt von dem Testsystem und der Behandlung der Mikrotiterplatten wesentlich ab. Dann wird 
Serum bzw. SerumverdUnnungen. die von der zu untersuchenden Person stammen, in die LScher der 
Mikrotiterplatten gegeben. Nach einer bestimmten Inkubationszeit wird die Platte gewaschen und spezifi- 
sche Immunkomplexe werden nachgewiesen durch Antikdrper, die spezifisch an menschliche Immunglobu- 
line binden und die vorher mit einem Enzym. beispieisweise Meerrettichperoxidase, alkalischer Phosphata- 
se usw. verbunden wurden oder mit enzymmarkiertem Antigen. Diese Enzyme konnen ein farbloses 
Substrat in ein stark gefSrbtes Produkt umwandeln und an der Starke der FSrbung kann dann das 
Vorhandensein von spezifischen Anti-HIV-Antikorpern abgelesen werden. Eine weitere Moglichkeit der 
Verwendung des erfindungsgemasen Virus in Testsystemen ist die Verwendung in Western Blots. 
Auch wenn die Herstellung von Impfstoffen gegen Immunschwacheerkrankungen sich als auBerst schwierig 
erweist. kann doch auch dieses Virus bzw. Tetle davon, d.h. immundominante Epitope und Induktoren der 
zellulSren Immunrtat. oder gentechnologisch hergestellte Antigene zur Entwicklung und Herstellung von 
Impfstoffen verwendet werden. 
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B IspleM 

Das erfindungsgemMBe Immunschwache-Virus MVP-51 80/91 wurde aus dem Blut einer Patiemin mit 
Zeichen von Immunschwache isoliert, Hierzu wurden periphere mononukleMre Zelten (peripheral blood 
lymphocytes, PBL) und periphere Lymphozyten aus dem Blut (PBL) eines nicht HIV-infizierten Spenders 
mit PhytohSmagglutinin stimuliert und in Kultur gehalten. Verwendet wurde hier2u das Qblich Medium 
RPMI 1640 mit 10 % fStalem Kaiberserum. Die Kulturbedingungen sind beschrieben in Landay A. et al., J. 
Inf. Dis.. 261 (1990) S. 706-710. Beobachtet wurde dann die Bildung von Riesenzellen unter dem 
Mikroskop. Die Produktion von HIV-Viren wurde Ober die Bestimmung des p 24-Antigens mit Hitfe des 
kauflich erwerbbaren Tests von Abbott bestimmt Ein werterer Test zur Bestimmung des Wachstums der 
Viren war der Test unter Verwendung von partikelgebundener Reverser Transkriptase (Eberle J., Seibl R. # J, 
Virol. Methods 40. 1992, S. 347-356). Das Wachstum der Viren wurde also anhand der enzymatischen 
AktivitSten im Kulturtiberstand ein- bis zweimal pro Woche bestimmt, urn die Virusproduktion zu Qberwa- 
chen. Wdchentlich einmal wurden neue Spenderlymphozyten zugegeben. 

Nachdem eine HIV-Virenvermehrung festgestelK werden konnte, wurden frische periphere Lymphozyten 
aus dem Blut (PBL) nicht HlV-irrfizierter, gesunder Spender mit dem Ober stand der ersten Kultur infiziert 
Dieser Schritt wurde wiederholt und dann wurden mit dem Oberstand H 9 bzw. HUT 78 Zellen infiziert Auf 
diese Weise war eine permanente Produktion des Immunschwache-Virus mdglich. Das Virus wurde bei der 
ECACC unter der Nr. V 920 92 31 8 hinterlegt „. 

Beisplel 2 

Zum Nachweis von HIV-lnfektionen ist derzeit der sogenannte Western Blot oder Immunoblot ein 
Standardverfahren. GemSB der in J, Virol Meth. 15 (1987) S. 11-23 von QUrtler et al. beschriebenen 
Vorgehensweise wurden verschiedene Seren untersucht Hierbei wurden Seren von deutschen Patienten 
solchen Seren gegenQbergestelfc die von afrikanischen Patienten erhalten wurden. Es wurden hierbei 
folgende Ergebnisse erhalten: 



Virustyp 


deutsche Seren 


afrikanische Seren 


HIV-1, Virus isoliert von 
deutschem Patienten 
MVP-51 80/91 


starke Reaktion 

keine bis schwache Reaktion mit gp 41 


starke Reaktion mit gp 41 
starke Reaktion 



Die oben dargestellten Ergebnisse zeigen, daB ein aus deutschen Patienten isoliertes Virus vom HIV-1 
Typ, wenn es zum Nachweis von HIV-lnfektionen verwendt wird, moglicherweise keine eindeutigen 
Ergebnisse liefert, wenn der Patient infiziert wurde mit einem Virus, das dem erfindungsgemaBen MVP- 
51 80/91 entspricht Es wird dabei davon ausgegangen, daB mit Hilfe des erfindungsgemaBen Virus solche 
Viren nachgewiesen werden kfinnen, die wenigstens etwa 85 % Homologie, bezogen auf das Gesamtge- 
nom, zu dem erfindungsgemaBen Virus aufweisen. 

Beisplel 3 

GemSB der in Beispiel 2 angegebenen Vorgehensweise wurden weitere Western Blots durchgefTJhrt 
Die Ergebnisse sind in der anliegenden Figur 3 dargestellt. Bei diesem Test wurde einmal das virale Protein 
des erfindungsgemaBen Immunschwache-Virus MVP-51 80/91 und einmal das viraie Protein eines HIV-1- 
Typ Virus (MVP-899) gelelektrophoretisch aufgetrennt und dann auf Zellulosefilter transferiert. Diese 
Rlterstreifen wurden mit den Seren von verschiedenen Patienten inkubiert und dann wurden die spezifi- 
schen AntikSrper durch eine Farbreaktion sichtbar gemacht Die links Haifte der Rgur mit der Oberschrfft 
MVP-51 80 zeigt das erfindungsgemaSe Immunschwache-Virus. Die rechte HSIfte der Figur zeigt ein aus 
deutschem Spender tsoliertes Virus (MVP-899), bei dem es sich urn ein HIV-1 -Virus handert 

Die einzelnen Rlterstreifen wurden nun mit den Seren von verschiedenen Patienten inkubiert. Betrachtet 
man die Rgur 3, so wurden jeweils dieselben Seren (von deutschen Patienten) umgesetzt mit je zwei 
Rlterstreifen, wobei die Nummern 8 und 26; 9 und 27; 10 und 28; 1 1 und 29; 12 und 30; 13 und 31; 14 und 
32; 15 und 33 sowie 16 und 34 die gleichen Seren bezeichnen. Bei den Western Blots mit den Nummern 
17 und 18 wurden Seren von afrikanischen Patienten eingesetzt. Die Zahlen an den rechten Seitenrandern 
geben die annShernden Molekulargewichte in Tausend (KD) an. 
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Die Rgur 3 zeigt deuttich. dafl Seron von deutschen Patienten mit dem erfindungsgemaBen Immun- 
schwache-Virus im Western Blot mit dem gp 41 nur sehr schwach reagleren. Seren von afrikanischen 
Patienten dagegen reagieren mit dem erfindungsg mSBen Immunschwache-Virus sehr stark. Figur 3 macbt 
daher deutlich, dafl unter Verwendung des erfindungsgemaBen ImmunschwSche-Virus solche Immunschwa- 
che-lnfektionen nachgewiesen werden kOnnen. die bei Verwendung eines HIV-1 oder HIV-2-Virus nur 
fragliche. also nicht eindeutig positive Ergebnisse liefern. Diese Nachweismoglichkeit kann wertreichende 
diagnostisch Bedeutung haben, da in den Fallen, in denen nur fragliche Ergebnisse im Western Blot erz.elt 
werden nicht mit eindeutiger Sicherheit festgestelrt werden kann, ob es sich urn eine Infektion mit einem 
Immunschwache-Virus handelt. Wenn aber mit Hitfe des erfindungsgemSBen tmmunschwache-Virus derarti- 
ge fragliche Ergebnisse einer Infektion mit einem Virus des erfindungsgernaBen Typs zugeondnet werden 
kSnnen. dann stellt dies einen erheblichen diagnostischen Fortschritt dar. 



Belsplel 4 

75 DNA-lsolierung t Amplifizierung und strukturelle Charakterisierung von Genomabschnitten des HIV-lsolates 
MVP-51 80/91 

Genomische DNA aus MVP-51 80/91 -infizierten HUT 78-Zellen wurden nach Standardmethoden isoliert 
Zur Charakterisierung von Genombereichen des Isolates MVP-51 80>91 wurden PCR (Polymerase Chan 
ReactlonhExperlmente mit einem Primerpaar aus dem HGIIproteinbereich gp 41 durchgefOhrt. Die Durch- 
fUhrung der PCR-Experimente erfolgte nach der Methode von Saiki et al. (SaiW at al., Science 239: 487- 
491 1988) mit folgenden Modifikationen: FQr die Amplifikation HIV-spezffischer DNA-Bereiche wurden 5 ul 
genomische DNA aus MVP-5180791 inflzierten HUT 7&-Zellen in einem 100 ul Reaktionsansatz (0,25 mM 
dNTP je 1 UM Primer 1 und Primer 2, 10 mM Tris HCI pH 8.3. 50 mM KCI. 1.5 mM MgCfe. 0.001 % 
Gelatine. 2.5 units Taq Polymerase (PerWn Elmer) pipettiert und nach folgendem Temperatur-Programm 
amplifiziert: 1. Initiate Denaturierung: 3' 95 -C. 2. Amplifikation: 90" 94- C. 60" 58- C. 90" 72'C (30 

CyC Dte'fUr die PCR und die Nucleotidsequenzierung verwendeten Primer wurden auf dem Oligonucletid- 
synthesizer 8750 der Firma Biosearch synthetisiert (Seq. ID No. 35 + 36). 



20 



28 



30 



35 



40 



50 



Primer 1: AGC AGC AGG AAG CAC TAT GG (Koordinaten aus HIV 1 
isolat HXB2: Base 7795-7814, entspricht Primer sk 68) 

Primer 2: GAG TTT TCC AGA GCA ACC CC (Koordinaten aus HIV 1 
isolat HXB2: Base 8003-8022, entspricht Primer env b) . 

Die amplifizierte DNA wurde Ober ein 3 % "Nusieve'-Agarosegel (Fa. Biozyme) aufgetrennt, das 
amplifizierte Fragment ausgeschnitten und mit dem gleichen Volumen an Puffer (IxTBE (0.09 M TnsBorat. 
0 002 M EDTA pHS.O) versetzt. Nach Inkubation des DNA-Agarosegemisches fOr 10 Minuteti bei 70 *C und 
nachfolgender Phenolextraktion wurde die DNA aus der wSssrigen Phase durch Zugabe von 1/10 Vol 3M 
NaAc pH 5.5 und 2 Vol Ethanol bei -20* C 15' gefSllt und anschliefiend in einer Zentrifuge (Eppendorf) 
pelletiert (13000 rpm, 10'. 4*C). Die pelletierte DNA wurde getrocknet. in Wasser aufgenommen und nach 
der photometrischen Bestimmung der ONA-Konzentration bei 260 nm im Spektralphotometer (Beckman) 
nach der Methode von Sanger (F. Sanger, Proc. Natl.Adac.Sci.. 74: 5463. 1977) sequenziert Anstelle der 
Sequenzierung mit Klenow DNA Polymerase, wurde die Sequenzierungsreaktion mil einem Kit von Applied 
Biosystems ("Taq Dye Deoxy Terminator Cycle Sequencing". Best-Nr.: 401150) durchgefOhrt. Als Pnmer 
wurden in getrennten Sequenzierungsreaktionen Primer 1 oder Primer 2 (jeweils 1 uM) eingesetet. Die 
Analyse der Sequenzierungsreaktion erfolgte auf dem DNA-Sequenziergerat 373A (Applied Biosystems) 
nach den Vorgaben des Gerateherstellers. 

Die Nucleotidsequenz des amplifizierten DNA-Bereichs und die davon abgeleitete AminosSuresequenz 
ist in der Tabelle 1 dargestellt (Sequ. ID No. 37-39). 
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Tabelle 1: 



GCGCAGCGGCAACAGCGCTGACGGTACGGACCCACAGTGTACTGAAGG6TAIAGTGCAAC 

CGCGTCGCCGTTGTCGCGACTGCCATGCCTGGGTGTCACATGACTTCCCATATCACGTTG 

AAATALTVRTHSVLKGIVQQ 

AGCAGGACAACCTGCTGAGAGCGATACAGGCCCAGCAACACTTGCTGAGGTTATCTGTAT 
+ + + + h + 

TCGTCCTGTTGGACGACTCTCGCTATGTCCGGGTCGTTGIGAACGACTCCAATAGACATA 

QDN LL RAIQAQQHLLRLSVW 

GGGGTATTAGACAACTCCGAGCTCGCCTGCAAGCCXTAGAAACCCTTATACAGAATCAGC 

CCCCAIAATCTGTTGAGGCTCGAGCGGACGTTCGGAATCTTTGGGAATATGICTTAGTCG 

GIRQLRARLQALETLIQNQQ 

AACGCCTAAACCTAT 
+ 195 

TTGCGGATTTGGATA 
R L N L 



Belsplel 5 

Die gefundene Nucleotidsequenz aus Tabelle 1 wurde auf homologe Sequenzen in der GENEBANK- 
Datenbank (Release 72, Juni 1992) mit Hilfe des GCG-Computerprogramms (Genetic Computer Group, Inc., 
Wisconsin USA, Version 7.1, MSrz 1992) urrtersucht. In dieser Datenbank sind die meisten der bis Juli 1992 
bekannten Nucieotidsequenzen von Immundefizienzviren humanen Ursprungs und von Isolaten aus Prima- 
ten enthalten. 

Die Nucleotidsequenz aus Tabelle 1 weist im besten Fall eine 66 %ige Homologie zu einem 
Schimpansen-lsolat auf. Zu HIV 1-lsolaten ist MVP 5180/91 in der untersuchten DNA-Sequenz im besten 
Fall zu 64 % homolog. Zu HIV 2-lsoiaten ist die DNA aus Tabelle 1 zu 56 % homolog. AuBer der Sequenz 
des Schimpansenisolates besteht die beste Homologie zwischen der Nucleotidsequenz aus Tabelle 1 und 
DNA-Abschnitten aus Primatenisolaten (SIV: Simian Immunodeficiency Virus) in einer DNA-Sequenz, die ft)r 
einen Teilbereich des HQIIproteins des Isolates SIV (Afrikanische Meerkatze) TYO-1 kodiert. Die Homologie 
betragt 61,5%. 

Belsplel 6 

Die gefundene Aminosauresequenz aus Tabelle 1 wurde auf homologe Sequenzen in der SWISSPROT 
Protein-Datenbank (Release 22, Juni 1992) mit Hilfe des GCG-Computerprogramms untersucht In dieser 
Datenbank sind die meisten der bis Juni 1992 bekannten Proteinsequenzen von Immundefizienz-Viren 
humanen Ursprungs und von Isolaten aus Primaten enthalten. 

Die Aminosauresequenz aus Tabelle 1 ist im besten Fall mit 62,5 % zu einem HOIIproteinabschnitt des 
oben genannten Schimpansenisolates homolog. Unter HIV 1-Hullproteinen findet man die beste Homologie 
mit der Aminosauresequenz aus Tabelle 1, in dem Isolat HIV 1 Mai. Die Homologie betragt 59 %. Zu HIV 2- 
Hullproteinen betragt die Homologie mit der Aminosauresequenz aus Tabelle 1 im besten Fall 52 % (Isolat 
HIV 2 Rod). Da auch HIV 1 und HIV 2-lsolate im besten Fall im korrespondierenden Proteinabschnitt nur zu 
64 % identisch sind, scheint es sich bei dem Isolat MVP-51 80/91 urn eine HIV-Variante zu handeln, die sich 
deutlich von HIV 1 und von HIV 2 strukturell abgrenzt und somit einen Vertreter einer davon unabhangigen 
Gruppe von HIV-Viren reprasentiert. 
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Die AminosSuresequenz des amplifizierten DNA-Bereiches (Tabelle 1) des HIV-teolates MVP 5180/91 
Uberiappt mit einem immundiagnostisch wichtigen Bereich aus dem HUllprotein gp 41 von HIV 1 (Amino- 
saure 584-6180 (Tabelle 2) (Gnann et al.. J. Inf. DIs. 156: 261-267, 1987; Norrby et al., Nature, 329: 248- 
250, 1987). 

5 Korrespondierende Aminosaurebereiche aus den HUllproteinen von HIV 2 und SIV sind ebenfalls 
immundiagnostisch konserviert (Gnann et al., Science, S. 1346-1349, 1987). So werden Peptide aus diesem 
HGIIproteinbereich von HIV 1 und HIV 2 in vielen kommerziell erhSitlichen HIV 1/2 AntikSrpef-Screeningtests 
als Festphasenantigene eingesetzt. UngefShr 99 % der ami HIV 1 und anti HIV 2 positiven Seren kSnnen 
dam it erfaBt werden. 

w Der Aminos5urebere»ch des MVP-51 80/91 -HUllproteins (Tabelle 1) k6nnte aufgrund der Uberlappung 
mit dem immundiagnostisch wichtigen Bereich aus gp 41 serodiagnostisch von Bedeutung sein. Dies ware 
insbesondere dann der Fail, wenn Antiseren von HIV-infizierten Patienten mit kemem der kommerziell 
erhaKlichen Antik6rper-Screeningtests positiv reagieren wilrden. In diesen FSIIen k6nnte eine Infektion mit 
einem MVP-51 80V91 eng verwandten Virus vorliegen. 

75 

Tabelle 2: 



RIIAVERYLKDQQLLGIWGCSGKLICTTAVPWro^ 

* |: hi ""II h« 

WGIRQLRARLQALETLIQNQQRLNL 



as Belsplel 7 

DNA Isolierung, Ampllfizierung und strukturelle Charakterisierung von Genomabschnitten dee HIV Isolates 
MVP-51 80/91 (kodierend fOr gp 41) 

M Genomische DNA aus MVP-51 80/91 -inflzierten HUT78-Zellen wurden wie beschrieben isoliert. 

Zur Charakterisierung von Genombereichen des Isolates MVP-51 80/91 wurden PCR (Polymerase Chain 
Reaction)-Experimente mit Primerpaaren aus dem HOIIproteinbereich gp 41 durchgefUhrt. Die PCR (Saiki et 
al.. Science 239: 487-491, 1988) und inverse PCR (Triglla et al., Mud. Asids, Res. 16: 8186, 1988) wurden 
mit folgenden Modifikationen durchgefOhrt: 

35 

1. PCR 

FOr die Amplication HIV-spezrfischer DNA Bereiche wurden 5 ul (218 ug/ml) genomische DNA aus 
MVP-51 80/91 infizierten HUT78 Zellen in einem 100 ul Reaktionsansatz (0,25 mM dNTP, je 1 uM Primer 
40 163env und Primer envend. 10 mM Tris HCI pH 8.3. 50 mM KCI, 1.5 mM MgCfe. 0.001 % Gelatine. 2,5 
units Taq Polymerase (Perkin Elmer)) pipettiert und nach folgendem Temperaturprogramm amplifiziert: 1. 
Initiale Denaturierung: 3 min. 95 *C, 2. Amplifikation: 90 sec. 94* C. 60 sec. 56 *C, 90 sec. 72 -C (30 
Cyclen). 

45 2. Inverse PCR 

Der 5' Bereich von gp 41 (N-Terminus) und die 3* Sequenz von gp 120 wurden mittels "inverser PCR" 
amplifiziert. Hierzu wurden 100 ul einer genomischen DNA Preparation (218 ug/ml) aus MVP-51 80/91- 
infizierten HUT78-Zellen in einem Endvolumen von 200 ul mit 10 units der Restriktionsendonuldease Sau3a 

so 1 Stunde bei 37 *C verdaut Die DNA wurde anschliefiend phenolisiert und mit Natriumazetat (Endkonzen- 
tration 300 mM) und 2.5 Volumen Ethanol 10 min bei -70 *C gefallt. in der Eppendorfzentrifuge abzentrrfu- 
giert und das Pellet getrocknet und in 890 ul Aqua dest resuspendiert. Nach Zugabe von 100 ul 
Ugasepuffer (50 mM Tris HCI, pH 7,8, 10 mM MgCfe. 10 mM DTT. 1 mM ATP. 25 ug/ml Rinderserumatbu- 
min) und 10 Ul T4 DNA-Ugase (Fa Boehringer, Mannheim) wurden die DNA-Fragmente 3 Stunden bei 

55 Raumtemperatur Hgiert. erneut phenolisiert und mit Natriumazetat und Ethanol wie oben gefallt. Nach dem 
Abzentrifugieren und Trocknen wurde die DNA in 40 ul Aqua dest. resuspendiert und mit 10 units der 
Restriktionsendonuklease Sad (Fa. Boehringer. Mannheim) fUr 1 Stunde verdaut. AnschlieBend wurden 5 ul 
dieses Ansatzes in einem PCR- Experiment wie unter "1. PCR" dargestellt. eingesetzt. Anstelle der Primer 



11 



EP 0 591 914 A2 



163env und envend wurden fQr die inverse PCR die Primer I68i und 16di verwendel 

Die Primer I63env, 168i und 169i wurden aus der bererts ermrttelten Teiisequenz des HIV-lsolates 

MVP-5180 ausgewShtt (Beispiel 4). 

Die fUr die PCR/inverse PCR und die Nucleotidsequenzierung verwendeten Prim r wurd n auf dem 
5 Oligonucleotidsynthesizer 8750 der Firma Biosearcrt synthetisiert, wobei die Primer foigende Sequenzen 

aufwiesen (Sequ. ID No. 40-43): 

Primer 163env: 5 f CAG AAT CAG CAA CGC CTA AAC C 3.' 

10 Primer envend: 5' GCC CTG TCT TAT TCT TCP AGG 3' 

(Position aus HIV 1 Isolat BH10: 
Base 8129-8109) 

Primer 168i: 5* GCC TGC AAG CCT TAG AAA CC 3' 

" Primer 169i: . 5' GCA CTA TAC CCT TCA GTA CAC TG 3* 



Die ampiifizierte DNA wurde Ober ein 3 % "Nusieve"-Agarosegel (Fa* Biozyme) aufgetrennt, das amplifizier- 
te Fragment ausgeschnitten und mrt dem gleichen Volumen an Puffer (1xTBE (0.09 Kf-TrisBorat 0.002 M 

20 EDTA, pH 8.0)) versetzt Nach Inkubation des DNA-Agarosegemisches fQr 10 Minuten bel 70 4 C und 
nachfolgender Phenolextraktion wurde die DNA aus der w&ssrigen Phase durch Zugabe von 1/10 Vol 3M 
NaAc, pH 5,5 und 2 Vol Ethanol bei -20 *C 15' getaitt und anschlieBend in einer Eppendorfzentrifuge 
pelletjert (I3000rpm, 10*, 4*C). Die pelietierte DNA wurde getrocknet in Wasser aufgenommen und nach 
der photometrischen Bestimmung der DNA-Konzentration bei 260nm im Spektralphotometer (Fa Beckman) 

25 nach der Methode von Sanger (F. Sanger, Proc. Natl. Acad. Sci., 74:5463, 1977) sequenzjert Anstelle der 
Sequenziening mrt Klenow DNA Polymerase wurde die Sequenzierungsreaktion mrt einem tot der Fa 
Applied Biosystems ("Taq Dye Deoxy Terminator Cycle Sequencing 1 ', Best Nr.: 401150) durchgefUhrt. Als 
Primer wurden in getrenrrten Sequenzierungsreaktionen Primer 163env oder Primer envend Qeweils 1uM) 
eingesetzt. Die amplrfizierte DNA aus dem inversen PCR-Experiment wurde mit den Primem 168i und 1691 

30 sequenziert Die Analyse der Sequenzierungsreaktion erfolgte auf dem DNA-Sequenziergerat 373A (Applied 
Biosystems) nach den Vorgaben des Ger&teherstellers. 

Die Nucleotidsequenz des amplrfizierten DNA-Bereichs und die davon abgelertete Aminos^uresequenz 
sind in der Tabelle 3 dargesteltt (Sequ. ID No. 44-46). 

3$ 



40 



45 



50 



55 
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Tabelle 3 



AAATGTCAAGACCAATAATAAACATTCACACCCCTCACAGGGAAAAAAQAGCAGTAGGAT 

1 + ► ♦ ♦ + + 60 

TTTACAGTTCTGGTTATTATTTGTAAGTGTGGGGAGTGTCCCTTTTTTCTCGTCATCCTA 

M S R P I I N I HTPHREKRIAV6L 

gpl2(* -I > gp41 

1Q TGGGAATGCTATTCTTGGGGGTGCTAAGTGCAGCAGGTAGCACTATGGGCGCAGCGGCAA 

1 ACCCTTACGATAAGAACCCCCACGATTCACGrCGTCCAXCGTGATACCCGCGTCGCCGXT 

GMLFLGVL S AAGSTMGAAAT 

75 CAGCGCTGACGGTACGGACCCACAGTGTACTGAAGGGTATAGTGCAACAGCAGGACAACC 

1 2 1 +- + + + + + 1 8 0 

GTCGCGACTGCCATGCCTGGGTGTCACATGACTTCCCATATCACGTTGTCGTCCTGTTGG 

ALTVRTHSVLKGIVQQQDNL 

20 TGCTGAGAGCGATACAGGCCCAGCAACACTTGCTGAGGTTATCTGTAXGGGGTXTTAGAC 

181 ~+ H + + ► + 240 

ACGACTCTCGCTATGTCCGGGTCGTTGTGAACGACTCCAATAGACATACCCCATAATCTG 

L R A I QAQQ H LLRLSVWG I RQ 

25 AACTCCGAGCTCGCCTGCAAGCCTTAGAAACCCTTATACAGAATCAGCAACGCCTAAACC 

24t + + + 4 + + 300 

TTGAGGCTCGAGCGGACGTTCGGAATCTTTGGGAATATGTCTTAGTCGTTGCGGATTTGG 

LRARLQALETLIQNQQRONL 

30 TATGGGGCTGTAAAGGAAAACTAATCTGTTACACATCAGTAAAATGGAACACATCATGGT 

3 o 1 + + + + + + 360 

ATACCCCGACATTTCCTTTTGATTAGACAATGTGTAGTCATTTTACCTTGTGTAGTACCA 

WGCKGKLICYTSVKWKTSWS 

36 CAGGAGGATATAATGATGACAGTATTTGGGACAACCTTACATGGCAGCAATGGGACCAAC 

361 + + + + + + 420 

GTCCTCCTATATTACTACTGTCATAAACCCTGTTGGAATGTACCGTCGTTACCCTGGTTG 

GGYNDDSIWDNLTWQQWDQH 

40 

ACATAAACAATGTAAGCTCCATTATATATGATGAAATACAAGCAGCACAAGACCAACAGG 



TGTATTTGTTACATTCGAGGTAATATATACTACTTTATGTTCGTCGTGTTCTGGTTGTCC 
INNVSSIIYDEIQAAQDQQE 



50 



55 



13 



AAAAGAATGTAAAAGCATTCTTGGAGCTAGATGAATGOGW ^ 
48 1 TMTCTCXCATTTTCGTAACAACCTCGATCTACTTACCCGGAGAQAAACCTTAACCAAAC 
KHVKALLELDEWASLWHWP O 
ACATAACTAAATGGTTGTGGTATATAAAAATAGCTATAATCATAGTGGGAGCACTAATAG 

541 + + ♦ + — +-■ . — ► ecu 

TGTATTGATTTACCAACACCAIATATTTTIATCGATATTAGIATCACCCTCGTGAITATC 
I TKWLWYIKIAIIIVGALI G 

GTATAAGAGTTATCATGATAGTACTTAATCTAGTGAAGAACATTAGGCAGGGATATCAAC 

so . + _+ + + + ' no" 

CATATTCTCAATAGTACTATCATGAATTAGATCACTTCTTGTAATCCGTCCCTATAGTTG 

IRVIMI VLMLVKMIRQOVQP 
CCCTCTCGTTGCAGATCCCTGTCCCACACCGGCAGGAAGCAGAAACGCCAGGAAGAACAG ^ 

561 GGGAGAGCAACGTCMGGGAttGt^ 

LSLQIPVPHRQEABTPGRTG 

GAGAAGAAGGTGGAGAAGGAGACAGGCCCAAGTGGACAGCCTTGCCACCAGGATTCTTGC 

7-,. + |— ■» ♦ + 780 

" CTCTTCTTCCACCICXTCCTCTGTCCGGGTTCACCTGTCGGAACGGTGGTCCTAAGAACG 

BEG GEGDRPK WTALPPGFLQ 

AACAGTTGTACACGGATCTCAGGACAATAATCTTGTGGACWACCACCTCTTGAGCAACT 

, fl1 + -+ + + + + 840 

TTGTCAACATGTGCCTAGAGTCCTGTTATTAGAACACCTGAATGGXGGAGAACICGTTGA 

QLYTDLRTI I LWTYHLLSHL 

TAATATCAGGGATCCGGAGGCTGATCGACTACCTGGGACTGGGACTGTGGATCCTGGGAC g Q( . 

8 4 1 + + +- — — — •( + ► 

ATTATAGTCCCTAGGCCTCCGACTAGCTGATGGACCCTGACCCTGACACCTAG6ACCCTG 

ISGIRHI.IDYI.GLGI.MI1.GQ 
AAAAGACAATTGAAGCTTGTAGACTTTGTGGAGCTGTAATGCAATATTGGCTACAAGAAT 
TTTTCTGTTAACTTCGAACATCTGAAACACCTCGACATTACGTTATAACCGATGTTCTTA 

KTIEACRLCGAV MQYMLQEL 
TGAAAAATAGTGCTACAAACCTGCTTGATACTATTGCAGTGTCAGXTGCCAAtTGGACTG 

'ckktATCAC^TGTTTGGACGAACTATC^ 



961 



KNSATNLLD 



TIAVSVAMWTD 



ACGGCATCATCTTAGGTCTACAAAGAATAGGACAAGG ^ ^ 
TGCCGTAGTA6AATCCAGATGTTTCTTATCCTGTTCC 
G IILGLQRIGQ 
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B Isplel 8 

Die gefundene Nucleotidsequenz aus Tabelle 3 wurde auf homologe Sequenzen in der GENEBANK- 
Datenbank (Release 72, Juni 1992) mit Hilfe des GCG-Computerprogramms (Genetic Computer Group, Inc. 
Wisconsin USA, Version 7.1, M3rz 1992) untersucht In dieser Datenbank sind die meisten der bis Juli 1992 
bekannten Nucieotidsequenzen von Immundefizienzviren humanen Ursprungs und von Isoiaten aus Prima- 
ten enthalten. 

Die Nucleotidsequenz aus Tabelle 3 weist im besten Fall eine 62 %ige Homologie zu einem HIV 1- 
Isolat auf. Zu HIV 2 Isoiaten ist die DNA aus Tabelle 5 zu 50 % homolog. 

Die aus der Nucleotidsequenz aus Tabelle 3 abgeleitete Aminosauresequenz wurde auf homologe 
Sequenzen in der SWISSPROT Protein-Datenbank (Release 22, Juni 1992) mit Hilfe des GCG-Computer- 
programms untersucht. In dieser Datenbank sind die meisten der bis Juni 1992 bekannten Proteinsequen- 
zen von Immundefizienzviren humanen Ursprungs und von Isoiaten aus Primaten enthalten. 

Die Aminosauresequenz aus Tabelle 3 ist im besten Fall mit 54 % zu dem korrespondierenden 
HGIIproteinabschnitt eines Schimpansen-lsolates CIV (SJVcpz) homolog und zu 54.5 % zu dem HIV 1 -Isolat 
Mai. Zu HIV 2-HUIIproteinen betrSgt die Homologie mit der Aminosauresequenz aus Tabelle 3 im besten 
Fall 34 % (Isolat HIV 2 D194). 

Vergleicht man demgegenQber die gp 41 -Aminosauresequenz von HIV 1 mit den in der SWISSPROT- 
Datenbank vorhandenen HIV 1 gp 41-Sequenz, ergeben sich wie erwartet im besten Fall eine fast 100 %ige 
Homologie und im schlechtesten Fall eine 78 %ige Homologie. — 

Aufgrund dieser deutllchen strukturellen Unterschlede zwischen dem Sequenzbereich aus Tabelle 3 und 
dem korrespondierenden Abschnitt aus HIV 1 und HIV 2 scheint es sich bei dem Isolat MVP-51 80/91 urn 
eine HIV-Variante zu handeln, die sich von HIV 1 und HIV 2 deutlich strukturell abgrenzt. MSglicherweise ist 
MVP-51 80/91 einer eigenen, von HIV 1 und HIV 2 sich abgrenzenden Gruppe von HIV-Viren zuzuordnen. 

Das Peptid von Aminosaure 584-618 des HIV t-HUIIproteinbereichs ist von besonderem serodiagnosti- 
schem Interesse (Numerierung nach Wain Hobson et al.. Cell 40:9-17. 1985; Gnann et al.. J. Inf. Dis. 
156:261-267, 1987; Norrby et al., Nature, 329:248-250, 1987). Korrespondierende Aminosaurebereiche aus 
den HUilproteinen von HIV 2 und SIV sind ebenfalls immundiagnostisch konserviert (Gnann et al., Science, 
S. 1346-1349, 1987). So werden Peptide aus diesem HUHproteinbereich von HIV 1 und HIV 2 in vielen 
kommerziell erhattlichen HIV 1/2 Antik5rper-Screeningtests als Festphasenantigene eingesetzt UngefShr 99 
% der Anti-HIV 1 und Anti-HIV 2 poshlven Seren kSnnen damrt erfaBt werden. 

Der korrespondierende Aminosaurebereich des MVP-51 80/91 -HQHproteins (Tabelle 4) als auch das 
gesamte gp 41 dieses Isolates WJnnten serodiagnostisch insbesondere dann von Bedeutung sein, wenn 
Antiseren von HIV-inflzierten Patienten in kommerziell erhaitlichen AntikBrper-Screening-Tests nur schwach 
oder Uberhaupt nicht reagieren wUrden. In diesen Fallen konnte eine Infektion mit einem MVP-51 80791 eng 
verwandten Vims voriiegen. 



Tab. 4: 



1 RILAVERYLKDQQLLGIWGCSGKIjICTTAVPWNAS 

2 LQ L TLIQN R NL K Y S K T 



1 HIV 1 Aminosauresequenz aus gp41 

2 MvP5180-Sequenz aus gp41. Nur Unterschiede 2U der HIV 1- 
Sequenz sind ausgedruckt* 

Das Peptid, das mit Hilfe der von MvP 5180 stammenden Information aufgefunden wurde, hat also die 
Aminosauresequenz: RLQALETLIQNQQRLNLWGCKGKLICYTSVKWNTS. 

Gegenstand der vorliegenden Ertindung sind daher Peptide, die rekombinant oder synthetisch herge- 
stellt werden konnen und die oben angegebene Sequenz oder Teilsequenz aufweisen. wobei die Teilse-. 
quenzen wenigstens 6 aufeinanderfolgende Aminosauren, bevorzugt 9 und besonders bevorzugt 12 aufein- 
anderfolgende Aminosauren aufweisen. 
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B Isplel 9 



Klonierung des Gesamtgenoms des HIV-lsolates MvP5180 
5 a) Herstellung einer genomischen Bibliothek 

Genomische DNA aus MvP518Q-infizierten HUT78-Zellen wurde wie beschrieben isoliert. 
300 ug diesef DNA wurde in einem Volumen von 770 ul mit 0,24 U des Restriktionsenzyms Sau3A fQr 45 
min inkubiert Die dadurch nur partieil geschnittene DNA wurde anschlieBend Uber ein 0.7 %iges Agarose- 

w gel (low melting agarose. Nusieve) groBenfraktioniert und Fragmente zwischen 10 und 21 kb ausgeschnit- 
ten. Die Agarose wurde fUr 10 min bet 70 *C geschmolzen und mit demselben Volumen Puffer (1 x TBE, 
0,2 M NaCI) versetzt. AnschlieBend folgte nach zweimaliger Phenol- und einmaliger Chloroformextraktion 
die Fallung der DNA durch Zugabe von 1/10 Vol 3 M Natriumacetatlosung (pH 5,9) und 2.5 Vol Ethanol bei 
-70 ' C Kir 1 0 min. Die gefdltte DNA wurde abzentrifugiert, getrocknet und in einer Kionzentration von 1 ug/ul 

is in Wasser geltisL 

Die Ausbeute an groBenfraktioniertef DNA betrug etwa 60 ug. 5 ug dieser DNA wurden mit 1 U Alkalische 
Phosphatase im entsprechenden Puffer fQr 20 min bei 37*C inkubiert. Durch Abspaitung des S'-terminalen 
Phosphatrestes wurden so multiple Insertionen von grSBenfraktionierter DNA vermindert Dfe Phosphatase- 
behandlung wurde durch Phenolisierung gestoppt die DNA wie oben gefiltt und zusamraen mit 1 ug des 
20 Vektors (2 DASH, BamHI geschnitten. Stratagene Nr.: 247611) in 6 ul Gesamtvolumen mit 2 Weiss-Units 
Lambda T4 Ligase fQr 12 Stunden bei 15*0 ligiert Nach erfolgter Ligation wurde die DNA mit Hilfe eines 
Verpackungskits (Gigapack II Gold, Stratagene Nr.: 247611) genau nach Angaben des Herstellers in 
PhagenhUlfen verpackt 

as b) Radioaktive Markierung der DNA-Probe 

FUr die Markierung wurde der "Random Primed DNA Labeling Kit" von Boehringer Mannheim (Nr.: 713 
023) eingesetzt Markiert wurde das PCR-Produkt welches wie in Beispiel 3 beschrieben mit den Primem 
sk68 und envb erhaiten wurde. 1 ug dieser DNA wurde durch 2 x 5 min Kochen und anschlieBender 
30 AbkOhlung in Eiswasser denaturiert Zur Markierung wurden 50 mCi [a- w PJ-dCTP (NEN, Nr.: NEX-053H) 
zugegeben. Sonstige ZusStze wurden nach Herstellerangaben pipettiert Nach einer Inkubation von 30 min 
bei 37 ■ C erfolgte eine FaMlung der nun radioaktlv markierten DNA. 

c) Screening der Phagen-Bibliothek 

35 

Zu 200 ul einer bei 30* C Uber Nacht angezogenen KuKur (Stamm SRB(P2) [Stratagene, Nr.: 247611] 
in LB-Medium, welches 10 mM MgSOi, sowie 0,2 % Maltose enthielt) wurden 20000 pfu (Plaque forming 
units) der Bibliothek in 100 ul SM-Puffer (5,8 g NaCI, 2 g MgSO* 50 ml 1 M Tris. pH 7,5 und 5 ml einer 2 
% Gelatineltfsung in 1 I HjO geltfst) gegeben, die Phagen 20 min bei 37' C an die Bakterien adsorbiert, mit 

40 7,5 ml auf 55*C abgekGhlter Top-Agarose gemischt und auf einer vorgewa*rmten Lb-Agarplatte von 14 cm 
Durchmesser verteilt Nach etwa 8 Stunden erreichten die Plaques Konfluenz. Daraufhin wurden Nitrocellu- 
losefilter fur wenige Minuten auf die Platten gelegt und asymmetrische Markierungen angebracht. Nach 
vorsichtigem Abheben wurden die Filter fUr 2 min denaturiert (0,5 M NaOH, 1,5 M NaCI) und dann 5 min 
neutralisiert (0,5 M Tris. pH 8, 1,5 M NaCI). Nach anschlieflendem Backen der Filter bei 80 # C fUr 60 min, 

45 konnten die Filter mit der Probe hybridisiert werden. 

Zur Vorhybridisierung wurden die Filter in 15 ml HybridisierungslSsung (50 % Formamid, 0,5 % SDS, 5 x 
SSPE, 5 x Denhardt's Ldsung und 0,1 mg/ml Lachssperma-DNA) pro Filter bei 42* C unter SchQtteln 2-3 h 
inkubiert. Die [^Pl-markierten DNA-Proben wurden 2-5 min bei 100*0 denaturiert auf Eis abgekOhlt. der 
Vorhybridisierungslosung zugesetzt und 12 Stunden bei 42*C hybridisiert AnschlieBend wurden die Filter 

so bei 60' C zunachst mit 2 x SSC/0,1 % SDS, dann mit 0,2 x SSC/0,1 % SDS gewaschen. Nach Trocknen 
der Filter wurden Hybridisierungssignale mit Hirfe des Rdntgenfilms X-OMAT™ AR (Kodak) detektiert. 
Die Plaques, denen ein Signal zugeordnet werden konnte. wurden nach Elution in SM-Puffer in weiteren 
VerdUnnungsschritten vereinzelt. 

Der unten beschriebene Klon konnte nach dem Screening von 2 x 10 6 Plaques identifiziert werden. 

55 " 
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d) Isolierung der Phagen-DNA und Subklonierung 

Mit 10 ul eines Phageneluats in SM-Puffer, wurde eine Ubernachtkuitur des Wirtsstammes SRB (P2) so 
infiziert, da8 nach zunJichst dichtem Wachstum der Kultur nach etwa 6-8 h Lyse erfolgte. Von der lysierten 
Kultur wurden Zellreste durch zweimalige Zentrifugation be* 9000 g fOr 10 min abgetrennt. AnschlieBend 
wurden die Phagen durch Zentrifugation pelletiert (35000 g. I h), in 700 ul 10 mM MgS04 aufgenommen 
und solange phenolisiert, bis keine Proteininterphase mehr zu sehen war. Daraufhin wurde die Phagen-DNA 
gefSllt. mit dem Restriktionsenzynn EcoRI geschnitten und die daraus erhaitenen EcoRI-Fragmente in den 
Vektor Bluescript KS~ (Strategene, Nr.: 212208) subkloniert. tnsgesamt wurden 4 Klone erhalten: 



Plasmid 


Begtnn 1 


Ende 1 


pSPl 


1 


1785 


pSP2 


1788 


5833 


pSP3 


5834 


7415 


pSP4 


7680 


9793 



1 bzgl, der foigenden Gesamtsequenz 



Das fehlende StQck zwtschen Base 7416 und 7659 wurde durch PCR mit den Primern 157 (CCA TAA 
TAT TCA GCA QAA CTA G) und 226 (GCT GAT TCT GTA TAA GGG) erhalten, Als DNA-Template wurde 
die Phagen-DNA des KJons verwendet. Die Bedingungen fUr die PCR waren: 1.) lnitiale Denaturierung: 
94 *C, 3 min, 2.) Amplifikation: 1,5 min 94 'C, 1 min 56 'C und 1 min 72 *C fOr 30 ZyWen. 
Die Sequenzierung der DNA ertolgte wie in Beispiel 4 beschrieben. Vom gesamten Genom wurde sowohl 
der Strang- als auch der Gegenstrang sequenziert. Bei alien EcoRI Schntttstellen wurde durch PCR mit 
Phagen-DNA des Kions als DNA-Template verifiziert. dafl es sich an den SubkionUbergangen jeweils urn 
singulars EcoRI-Schnittstellen handeit. 

Tab. 5' 



Die Lage der Gene der Virusprotelne GAG, POL und ENV In der Gesamtsequenz von MvP5180 


Gen 


Start 1 


Stop 1 


GAG 


817 


2310 


POL 


2073 


5153 


ENV 


6260 


8887 



1 .) Die Zahien geben die Basenpositionen in der Gesamtsequenz von MvP5180/91 



Die Gesamtsequenz von MvP51 80/91 ist in Fig. 4 dargestellt 
Beispiel 10 

Abgrenzung der Gesamtsequenz von MvP51 80/91 von anderen HIV1-lsolaten 

Grundiage fOr die foigenden Sequenzvergleiche war die Datenbanken Genbank Release 75 von 2.93, 
EMBL 33 von 12.92 und Swissprot 24 von 1.93. Homologievergleiche erfolgten mit der GCG-Software 
(Version 7.2, 10.92. der Genetics-Computer-Group, Wisconsin). 

ZunSchst wurden auf AminosSureebene die Sequenzen von GAG, POL und ENV mit dem Programm 
"Wordsearch" mit der Datenbank verglichen. Die 50 besten Homologen wurden mit dem Programm 
"Pileup" jeweils untereinander verglichen. Daraus geht deutlich hervor, da3 MvP51 80/91 in den HIV1- 
Stammbaum faift, dort aber sehr frUh, sogar noch vor dem Schimpansenvirus SIVcpz abzweigt, also eine 
neue Subfamilie von HIV1 reprasentiert. Urn Zahienwerte fOr die Homologien zu erhalten, wurde mit dem 
Programm "Gap" MvP5180 mit den jeweils am besten passenden HIV1, HIV2 und SIV-Sequenzen und 
zusStzlich mit der SIVcpz-Sequenz verglichen. 
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Tab. 6 



H mologiewerto d r AmlnosSuresequ nzvn GAG, POL und ENV des MvP51 80/91-1 


s lat s 


QAQ 


SIVcpz 


70,2% 
83.6% 


HIV1U 2 


69,9% 
81 ,2% 




53,6% 
71.3% 


SIV1a* 


. 55,1% 
71 ,3% 


POL 


SIVcp2 


78,0% 
88,0% 


HIVIu 2 


76,1% 
86,8% 


HIV2CJ 3 


57,2% 
71,9% 


SIVgb 5 


57,7% 
74,6% 


ENV 


SIVcpz 


53,4% 
87,1% 


HIV1h 1 


50.9% 
67.2% 


WV2CP 


34,4% 
58,7% 


SIVa* 


34,4% 
57,8% 



1 h = hz321 /Zaire, 
2 u = u455/Uganda. 

75 *a = agm155, 
5 gb=*gb1 

6 at=agm 

m Der obere Zahlenwert drtickt die Identity, der untere die Ahnlichkeit beider Sequenzen aus. 

Weiter wurde die Datenbank mit "Wordsearch" und "Gap" auf NuWeotidebene durchsucht. Die Homologie- 
werte ftir die jeweils besten "matches" sind in Tabelle 7 zusammengefaBt 

Tab. 7 

25 



Homologiewerte der Nuldeotldsequenz von MvP51 80/91 




HIV1 




HIV2 




gag 


HlVelicg 


70,24 % 


HIV2bihz 


60.0% 


pol 


HIVmal 


75,0 % 


HIV2cam2 


62,9% 


env 


HiVsimi84 


59,7% 


HIV2gha 


49,8 % 



35 

Beispiel 11 

Beschreibung der PCR Amplrfizierung, Klonierung und Sequenzierung des gag Gens des HiV 5180 Isolates 

40 Urn die im Laufe der Virusvermehrung auftretenden Spontanmutationen darzustellen. wurde ein Tail des 
Virusgenoms mit der PCR-Technik kloniert und die so erhaltene DNS-Sequenz vergiichen mit der Sequenz 
gema"B Fig. 4. 

Die gag Sequenz wurde vom LTR ("long terminal repeat", LTR1 primer) des linken Endes des MvP 
5180 Genomes bis in das pol (Polymerase Gen. pol3.5i primer) hinein aberlappend kloniert. Die Klonie- 
45 rungsstrategie ist in Rg. 5 schematisch dargestellt 

Die PCR Reaktionen wurden mit den u.g. DNA Primem. deren Sequenzen von der HIV-1 Konsensus- 
Sequenz abgeleitet wurden, durchgefuhrt Die Sequenzierungen erfolgten mit Hilfe der Dideoxykettenab- 
bntchmethode. 

Die fUr das MvP 5180 gag Gen kodierende Sequenz erstreckt sich von Nukleotid 817 (A des ATG 
so Startkodons) bis Nukleotid 2300 (A des letzten Kodons) (Sequ. ID No. 47-53). 
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LTR1: 5' - CTA GCA GTG GCG CCC GAA CAG G -3' 

gag3.5: 5' - AAT GAG GAA GCU GCA GAU TGG GA -3' (U-A/T) 

gag 3.5i: 5* - TCC CAU TCT GCO GCT TCC TCA TT -3* (U-A/T) 

gag5: 5' - CCA AGG GGA AGT GAC ATA GCA GGA AC -3' 

gag959: 5' - CGT TGT TCA GAA TTC AAA CCC -3' 

gaglli: 5* - TCC CTA AAA AAT TAG CCT GTC -3 1 

po!3.5i: 5* - AAA CCT CCA ATT CCC CCT A -3 1 



Die bei der PCR-Technik erhaitene DNS-Sequenz wurde der in Figur 4 dargestelrten DNS-Sequenz 
gegeniibergestellt. Ein Vergleich der beiden DNS-Sequenzen ist in Figur 6 dargestelft Hierbei wurde 
festgestellt daB sich die Nukleotide in ca 2 % voneinander unterscheiden, obwohl es sich um dasselbe 
Virus handelt In Rg. 6 stellt jeweils die obere Zeile die DNS-Sequenz dar. die in Fig. 4 dargestelft ist und 
die untere Zeile stellt die mrt PCR-Technik erhaitene DNS-Sequenz dar. 

Weiterhin wurde die AminosSuresequenz des mit PCR-Technik ermittelten Proteins gag der AminosaV 
resequertz des aus Rg. 4 abgeteiteten entsprechenden Proteins gegeniibergestellt Dabei wurde ein 
Unterschied der AminosSure von ca 22 % ermrttelt Der Vergleich ist in Rg. 7 dargestellt wobet die untere 
Zeile jeweils die AminosSuresequenz darstellt die von der mit PCR-Technik erhalteoen Sequenz abgeteitet 
wurde. 

Belsplel 12 

Es wurde die Sequenz des erfindungsgemfiBen Virus MvP 5180 verglichen mit den Konsensus- 
Sequenzen von HIV1 und HIV2 und soweit bekannt mit der Sequenz von ANT-70 (WO 89/12094). 
Dabei wurden folgende Ergebnisse erhaiten: 

Tab. 8 



Genort 


abweichende Nukleotide 


Zahl der Nukleotide 


% Homologie (genShert) 


LTR 


207 


630 


HIV-1 67 % 




308 




HIV-2 51 % 




115 




ANT 70 82 % 


GAG 


448 


1501 


HIV-1 70 % 




570 




HIV-2 62 % 


POL 


763 


3010 


HIV-1 74 % 




1011 




HIV-2 66 % 


VIF 


183 


578 


HIV-1 68 % 




338 




HIV-2 42 % 


ENV 


1196 


2534 


HIV-1 53 % 




1289 




HIV-2 49 % 


NEF 


285 


621 


HIV-1 54 % 




342 




HIV-2 45 % 


total 


3082 


8874 


HIV-1 65 % 




3858 




HIV-2 58 % 



In der obigen Tabelle bedeuten "HIV-1" Konsensus-Sequenzen von HIV-1 Viren; "Hrv-2" Konsensus- 
Sequenzen von HIV-2 Viren; ANT-70 aus der WO 89/12094 bekannte Teilsequenz eines als HIV-3 
bezeichneten Virus. 

Gegenstand der vorliegenden Erfindung sind daher Viren, DNS-Sequenzen, AminosSuresequenzen 
sowie Teilsequenzen davon, die eine solche Homologie mit der in Rg. 4 dargestellten Sequenz aufweisen, 
bezogen auf die Genorte, daB hdchstens die in Tabelle 9 angegebenen Anteile, ausgedruckt in %-Werten, 
unterschiedlich sind. 
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Tab! 9 



H mologl b zog n auf G norte, ausgedrUcM als maximale Unterschled 


Genort 


Unterscnlede 


dov rzugte uruerscmeus 


ins nuois mjwi fcuy wo 










LTR 


17 % 


15 % 


I U To 


GAG 


29% 


28% 


14% 


POL 


25% 


24% 


12% 


VIF 


31 % 


30% 


15% 


ENV 


46% 


45% 


22% 


NEF 


16% 


12% 


10% 



Die in Tabelle 9 angegebenen Homotogiewerte in % bedeuten, daB bei einer GegenQberstellung der 
Sequenz gemafl Rg. 4 mit einer Sequenz eines anderen Virus hSchstens ein den oben angegebenen 
Prozentwerten entsprechender Anteil der Sequenz unterschiedlich sein dart. 



Belsplel 13 — 

20 

V3-»oop / V3-Schlaufe 

Diese Schlaufe ist die hauptneutralisierende Region im HIV und die Dokumentation der immunotogi- 
schen Spezifitaten der Region sind in der Rgur 8 zusammengefaBt Dies ist eine Kopie aus AIDS aus einer 
25 Arbeit von Peter Nara (1 990). 

Die V3-Schlaufe ist dann in Aminosauren-Ebene aufgezeichnet und mit dem IIIB Virus jetzt LAI und dam 
ersten HIV-2 Isolat (ROD) verglichen. Einzelne Aminosauren an der Cystin-BrQcke sind konserviert 
Wahrend die Krone von HIV-1 GPGR Oder GPGQ ist und die von HIV-2 GHVF ist die Krone des 
MvP51 80/91 gebildet aus den Aminosauren GPMR. Das Motiv mit dem Methionin ist bisher nicht 
30 beschrieben worden und unterstreicht die Individualist des MvP 51 80/91 . 

Nachdem die Nukteinsajjresequenz des Virus ermittelt war, wurde der V3-Loop-Bereich mit HiHe der 
PCR-Technik urrter Verwendung geeigneter Primer amplifiziert Hierbei konnten Mutationen beobachtet 
werden, insbesondere eine Verinderung des Metheonin-Kodons (ATG) zu einem Leucin-Kodon (CTG). 
Nachfolgend wird eine GegenUberstellung der von der klonierten NukteinsSiure abgelerteten Aminoslu- 
J6 resequenz und der Sequenz gegeben, die nach Amplifizierung mittels PCR-Technologie erhalten wurde 
(Sequ. ID No. 54-55): 

MvP 5180 (kloniert) : 
40 CIREGIAEVQDIYTGPMRWRSMTLKRSNNTSPRSRVAYC 

MvP 5180 (PCR-Technik): 
45 CIREGIAEVQDLHTGPLRWRSMTLKKSSNSH1QPRSKVAYC 



Beispiel 14 

Urn zu zeigen, daB mit Hilfe des erfindungsgemaBen Virus MvP 5180 bzw. davon abgeleiteten 
Antigenen auch solche Seren ais HIV-1 positiv nachgewiesen werden konnen, die bei Verwendung eines 
normaien HIV-1 +2 Screening-Tests nicht erfa&t werden kdnnen, wurden verschiedene Seren von Patienten 
aus Kamerun im ElA-Test UberprOft 

Bet einer Studie in Kamerun wurden 158 Anti-HIV-1-positive Seren OberprOft Bei zwei dieser Seren 
wurden erhebiiche, diagnostisch relevante Unterschiede beobachtet. Bei der nachfolgenden Tabelle 10 
werden die gemessenen Extinktionen angegeben. CAM-A bzw. CAM-B stehen fQr die Seren verschiedener 
Patienten. 
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Tabelle 10 



5 



Patientenseren 


MvP5180-EIA 


HlV-1 + H1V-2 EIA 


CAM-A 
CAM-B 


2.888 
1.102 


1.623 
0.386 



Der Cutoff ftlr beide Tests betrug 0.300. 

In einer weiteren Studia mit 47 Anti-HIV-1-positiven Seren aus Kamerun flelen zwei Seren besonders 
10 auf. Bnes davon (93-1000) stammt von einem wenig symptomatischen, das andere (93-1001) von einem 
AIDS-kranken Patienten. In der folgenden Tabelle 11 werden die Extinktionswerte der beiden EIA-Testa 
einander gegenGbergestellt 

Tabelle 11 

T5 
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Patienten serum 


MvP 51B0-EIA 


HIV-1 + HIV-2 EIA 


93-1000 
93-1001 


> 2.5 
0.692 


1.495 
0.314 



Auch hier betrug der Cutoff 0.3. Die Extinktionswerte des Patienten 93-1001 zeigen, dafl der normale 
HIV-1 + HIV-2 EIA versagen kann, wohingegen durch Einsatz des erfindungsgemfiflen Antigens ein Warer 
Nachweis moglich ist 

28 

SEQUENZFROTOKOCiXi 



(1) ALLGEMEINE INFORMATION: 
ANMELDER: 

(A) NAME: Behringverke Aktiengesellschaf t 

(B) STRASSE: Postfach 11 40 

(C) ORT: Marburg 

(E) LAND: Germany 

(F) POSTLEITZAHL : 35001 

ANMELDETITEL : 

Retrovirus aus der HlV-Gruppe und 
dessen Verwendung 

ANZAHL DER SEQUENZEN: 60 

COMPUTER-LESBARE FORM: 

(A) DATENTRAGER: Floppy Disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: PADAT Sequenzmodul Version 1.0 



55 
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(2) INFORMATION ZO SBQ ID MO: 1: 

(i) SEQUENT CHARAKTERISTIKA: 

(A) L&NGE: 18 Basenpaare 

(B) ART: NUkleins&ure 

(C) STRANGFORM: Elnzal 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKtiLS: aynthetische DNA 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 1: 
CTACTAGTAC CCTTCAGG 



(2) INFORMATION 3U SEQ ID NO: 2: 

(1) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Binxel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 
CGG TCT ACA TAG TCT CTA AAG 



(2) INFORMATION ZO SEQ It) NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3 
CCACCTATCC CAGTAGGAGA A 
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(2) INFORMATION ZU SBQ ID NO: 4i 

(i) SEQUBNZ CHARACTERISTIC: 

(A) LANGE: 30 Basenpaare 

(B) ART: Nukleinaaure 

(C) STRANGFORM: Binzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: synthatische DNA 



(xi) SEQUENZBE5CHHEIBUNG: SEQ ID NO: 4: 
CCTTTGGTCC TTGTCTTATG TCCAGAATGC 



(2) INFORMATION ZU SEQ ID NO: 5.- 

(i) SEQOENZ CHARACTER I STIKA : 

(A) LANGE: 25 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzal 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtfLS: synthetische DNA 



(xi) SEQUENZBESCHRE IBUNG : SEQ ID NO: 5: 
TGGGAAGTTC AATTAGGAAT ACCAC 



(2) INFORMATION ZO SEQ ID 50: 6: 

(i) SEQUENZ CHARAXTERISIIXA: 

(A) LANGE: 26 Basenpaare 

(B) ART: Nukleinaaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 



CCTACATAGA AATCATCCAT GTATTG 
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(2) INFORMATION ZD SBQ ID NO: 7; 

(i) SEQUENZ CHARAXTERISTIKA: 

(A) L&NGE: 19 Basenpaare 

(B) ART: Nukleinsaur 

(C) STRANGFORM: Einz 1 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: synthetische DNA 



(xi) SEQUENZBESCHRBIBUNG: SEQ ID NO: 7: 
TGGATGTGGG TGATGCATA 



(2) INFORMATION ZU 5EQ ID NO: 8; 

(1) SEQUENZ CHARAXTERISTIKA: 

(A) LANGE: 21 Basenpaara 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK&LS: synthetische DNA 



(xi) SEQUENZBESCHRBIBUNG: SEQ ID NO: 8: 
AGCACATTGT ACTGATATCT A 



(2) INFORMATION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAXTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nuxleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtiLS: synthetische DNA 



(xi) SEQUENZBESCHRE IBUNG : SEQ ID NO: 9: 
AGTGGGGGGA CATCAAGCAG CC 



(2) INFORMATION ZU SEQ ID NO: 10. 

(i) SEQUENZ CHARAXTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaura 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS: synthetische DNA 



(xi) SEQUENZBESCHRE IBUNG : SEQ ID NO: 10: 
TGCTATGTCA CTTCCCCTTG GT 
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(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SEQUENZ CHAHAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinaaure 

(C) STRANGFORM: Binzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEXDTS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 
CCATGCAAAT GTTAAAAGAG AC 



(2) INFORMATION ZU SBQ ID NO: 12: 

(i) SEQUENZ CHARARTER I ST I KA : 

(A) LANGE: 19 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFOBM: Binzel 

(D) TOPOLOGIE: linear 

(ii) ART DES KOLEKtftiS: synthetische DNA 



(xi ) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 
GGCCTGGTGC AATAGGCCC 



(2) INFORMATION ZU SEQ ID NO: 13: 

(i) SEQUENZ CHARAXTERISTIXA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nuxleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOlS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 13: 
GTGCTTCCAC AGGGATGGAA 



(2) INFORMATION ZU SEQ ID NO: 14: 

(1) SEQUENZ CHARAKTERISTIKA: 

(A) L&NGE: 18 Basenpaare 

(B) ART: Nukleinaaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtlLS: synthetische DNA 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 
ATCATCCATG TATTGATA 
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(2) INFORMATION ZU SEQ ID NO: 15: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Binzel 

(D) TOPOLOGIE: linear 

(li) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: IS: 
AATGGAGCCA GTAGATCCTA 



(2) INFORMATION ZU SEQ ID NO: 16: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Elnzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBDNG: SEQ ID NO: 16: 
TGTCTCCGCT TCTTCCTGCC 



(2) INFORMATION ZU SEQ ID NO: 17: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGS: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetiache DNA 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 
GAGCCCTGGA AGCATCCAGG 



(2) INFORMATION ZU SEQ ID NO: 18: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: aynthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 
GGAGATGCCT AAGGCTTTTG 
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(2) INFORMATION ZU SEQ ID NO: 19: 

(i) SEQUENZ CHARACTER I ST XKA: 

(A) LANGB: 17 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEXULS: synthetische DHA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 
TGTTCCTTGG GTTCTTG 17 



(2) INFORMATION ZU SEQ ID NO: 20: 

(1) SEQUENZ CHARAKTERISTIKA: 

(A) LaNGE: 20 Basenpaare — 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(11) ART DES MOLEKULS: aynthetlsche DNA 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 
GAGTTTTCCA GAGCAACCCC 20 



(2) INFORMATION ZU SEQ ID NO: 21: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LaNGE: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: synthetische DNA 

(xi) SEQUENZBSSCHREI BUNG : SEQ ID NO: 21: 
AGCAGCAGGA AGCACTATGG 2C 



(2) INFORMATION ZU SEQ ID NO: 22: 

(1) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtiLS: synthetische DNA 

(Xi) SEQUENZBESCHRE I BUNG : SEQ ID NO: 22: 
GCCCCAGACT GTGAGTTGCA ACAG 24 
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(2) INFORMATION ZO SEQ ID NO: 23: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(Xi) SEQUENZBES CHRE I BUNG : SEQ ID NO: 23: 
GCACAGTACA ATGTACACAT GG 



(2) INFORMATION ZU SEQ ID NO: 24: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES M0LE1C0LS: synthetische DNA 



(xi) SEQUENZBESCHREIBONG: SEQ ID NO: 24: 
CAGTAGAAAA ATTCCCCTCC AC 



(2) INFORMATION ZU SEQ ID NO: 25: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 31 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 
TCAGGATCCA TGGGCAGTCT AGCAGAAGAA G 



(2) INFORMATION ZU SEQ ID NO: 26: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) L&NGE: 42 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 
ATGCTCGAGA ACTGCAGCAT CGATTCTGGG TCCCCTCCTG AG 
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(2) INFORMATION 20 SEQ ID HO: 27: 

(i) SEQUENZ CHARACTER I STIKA ; 
(A) LAKGE: 40 Basenpaare 
(3) ART; Nukleinsaure 

(C) STRANGPORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES HOLEKflLS: synthetische DMA 

(xi) SEQUENZBESCHREIBUHG: SEQ ID NO: 27: 
CGAGAACTGC AGCATCGATG CTGCTCCCAA GAACCCAAGG 40 



(2) INFORMATION ZU SEQ ID NO: 28: 



(i) SEQUENZ CHARACTER ISTIKA: 
(A) lANGE: 21 Basenpaare 
m (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzal 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: synthetische DMA 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 
GGAGCTGCTT GATGCCCCAG A 21 

(2) INFORMATION ZU SEQ ID NO: 29: 

(i) SEQUENZ CHARACTER I ST I KA: 
(A) LANGE: 22 Basenpaare 
35 (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: synthetische DMA 

40 (xi) SEQUENZ BESCHRE I BUNG : SEQ ID NO: 29: 

TGATGACAGC ATGTCAGGGA GT 21 



(2) INFORMATION ZU SEQ ID NO: 30: 

(i) SEQUENZ CHARACTERISTIC: 
(A) LANGE: 25 Basenpaare 
so (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: synthetische DMA 



(xi) SEQUENZBESCKREIBUNG: SEQ ID NO: 30: 
GCTGACATTT ATCACAGCTG GCTAC 25 
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(2) INFORMATION ZU SEQ ID NO: 31: 

(i) SEQUENZ CHARACTERISTIC: 

(A) LANGS: 27 Basenpaare 

(B) ART: NuJtleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS : synthetische DNA 



(Xl) SEQUENZBBSCHREIBUNG: SEQ ID NO: 31: 
TATCACCTAG AACTTTAAAT GCATGGG 



(2) INFORMATION ZU SEQ ID NO: 32: 

(1) SEQUENZ CHARAKTBRISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsiure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKUlS: synthetische DNA 



(xi) SEQUENZBBSCHREIBUNG : SEQ ID NO: 32: 
AGTCCCTGAC ATGCTGTCAT CA 



(2) INFORMATION ZU SEQ ID NO: 33: 

(1) SEQUENZ CHARAKTBRISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtlLS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 
GTGGAGGGGA ATTTTTCTAC TG 



(2) INFORMATION ZU SEQ ID NO: 34: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS: synthetische DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34 
CCTGCTGCTC CCAAGAACCC AAGG 
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(2) INFORMATION ZU SEQ ID NO: 35: 

(x) SEQUENZ CHARAXTERISTIXA: 

(A) LAN6E: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Primer 



(Xi) SEQUENZBESCHREIBUNG: SEQ ZD NO: 35: 
AGCAGCAGGA AGCACTATGG 



(2) INFORMATION ZU SEQ ID NO: 36: 

(i) SEQUENZ CHARACTER I ST I KA : 

(A) LANGB: 20 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 36: 
GAGTTTTCCA GAGCAACCCC 20 
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(2) INFORMATION ZU SEQ ID NO: 37: 

(i) SEQUENZ CHARACTER I ST I KA: 

(A) LANGE: 195 Basenpaare 
M (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Genom-DNA 

40 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 

GCGCACCGGC AACAGCGCTG ACGGTACGGA CCCACAGTGT ACTGAAGGGT ATAGTGCAAC 60 

AGCAGGACAA CCTGCTGAGA GCGATACAGG CCCAGCAACA CTTGCTGAGG TTATCTGTAT 120 

45 GGGGTATTAG ACAACTCCGA GCTCGCCTGC AAGCCTTAGA AACCCTTATA CAGAATCAGC 180 

AACGCCTAAA CCTAT 195 
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(2) INFORMATION ZU SEQ ID NO: 38: 

(t) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 195 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Genom-DHA 

(xi) SEQUBNZBESCHREIBUNG: SEQ ID NO: 38: 

CGCGTCGCCG TTGTCGCGAC TGCCATGCCT GGGTGTCACA TGACTTCCCA TATCACGTTG 60 

TCGTCCTGTT GGACGACTCT CGCTATGTCC GGGTCGTTGT GAACGACTCC AAIAGACAIA 120 

CCCCATAATC TGTTGAGGCT CGAGCGGACG TTCGGAATCT TTGGGAATAT GTCTTAGTCG 180 

TTGCGGATTT GGATA 19 S 



(2) INFORMATION ZU SEQ ID NO: 39: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 64 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(v) ART DES FRAGMENTS: inneres 

(Xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 39: 

Ala Ala Ala Thr Ala Leu Thr Val Arg Thr His Ser Val Leu Lya Gly 
15 10 15 

He Val Gin Gin Gin Asp Asn Leu Leu Arg Ala He Gin Ala Gin Gin 
20 25 30 

His Leu Leu Arg Leu Ser Val Trp Gly He Arg Gin Leu Arg Ala Arg 
35 40 45 

Leu Gin Ala Leu Glu Thr Leu He Gin Asn Gin Gin Arg Leu Asn Leu 
50 55 60 
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(2) INFORMATION ZU SEQ ID NO: 40: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM : Einzel 
(0) TOPOLOGIB: linear 

(11) ART DBS MOLEK&LS: Primer 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 40: 
CAGAATCAGC AACGCCTAAA CC 



(2) INFORMATION ZU SEQ ID NO: 41: 

(1) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukloina&ure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIB : linear 

(ii) ART DBS KOLEKtiLS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 41: 
GCCCTGTCTT ATTCTTCTAG G 



(2) INFORMATION ZO SEQ ID NO: 42: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 20 Basenpaare 

(B) ART: NUkleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIB: linear 

(ii) ART DES MOLEKOLS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 42: 
GCCTGCAAGC CTTAGAAACC 



(2) INFORMATION ZU SEQ ID NO: 43: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 23 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIB: linear 

(ii) ART DES MOLEKULS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 
GCACTATACC CTTCAGTACA CTG 
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(2) INFORMATION ZU SEQ ID NO: 44: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) L&NGE: 1057 Basenpaare 

(B) ART: NukXeinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(11} ART DES MOLEKOLS: Genom-DNA 



10 (Xi) SEQUENZBBSCHRE I BUNG : SEQ ID NO: 44: 





AAATGTCAAG 


ACCAATAATA 


AACATTCACA 


CCCCTCACAG 


GGAAAAAAGA 


GCAGTAGGAT 


60 




TGGGAATGCT 


ATTCTTGGGG 


GTGCTAAGTG 


CAGCAGGTAG 


CACTATGGGC 


GCAGCGGCAA 


120 


15 


CAGCGCTGAC 


GGTACGGACC 


CACAGTGTAC 


TGAAGGGTAT AGTGCAACAG 


CAGGACAACC 


1B0 




TGCTGAGAGC 


GATACAGGCC 


CAGCAACACT 


TGCTGAGGTT 


ATCTGTATGG 


GGTATTAGAC 


240 




AACTCCGAGC 


TCGCCTGCAA 


GCCTTAGAAA 


CCCTTATACA GAATCAGCAA CGCCTAAACC 


300 


20 


TATGGGGCTG 


TAAAGGAAAA 


CXAATCTGTT 


ACACATCAGT AAAATGGAAC ACATCATGGT 


360 




CAGGAGGATA 


TAATGATGAC 


AGXAXTTGGG 


ACAACCTTAC ATGGCAGCAA TGGGACCAAC 


420 




ACATAAACAA 


TGTAAGCTCC 


ATTATATATG 


ATGAAATACA AGCAGCACAA 


GACCAACAGG 


480 


25 


AAAAGAATGT 


AAAAGCATTG 


TTGGAGCTAG 


ATGAATGGGC 


CTCTCTTTGG AATTGGTTTG 


540 




ACATAACTAA 


ATGGTTGTGG 


TATATAAAAA 


TAGCTATAAT 


CATAGTGGGA 


GCACTAAZAG 


600 




GTATAAGAGT 


TATCATGATA 


GTACTTAATC 


TAGTGAAGAA 


CATTAGGCAG 


GGATAtCAA9 


660 


JO 


CCCTCTCGTT 


GCAGATCCCT 


GTCCCACACC 


GGCAGGAAGC 


AGAAACGCCA 


GGAAGAACAG 


720 




GAGAAGAAGG 


TGGAGAAGGA 


GACAGGCCCA 


AGTGGACAGC 


CTTGCCACCA 


GGATTCTTGC 


780 




AACAGTTGTA 


CACGGATCTC 


AGGAGAATAA 


TCTTGTGGAC 


TTACCACCTC 


TTGAGCAACT 


840 


35 


TAATATCAGG 


GATCCGGAGG 


CTGATCGACT 


ACCTGGGACT 


GGGACTGTGG 


ATCCTGGGAC 


900 




AAAAGACAAT 


TGAAGCTTGT 


AGACTTTGTG 


GAGCTGTAAT 


GCAATATTGG 


CTACAAGAAT 


960 




TGAAAAATAG 


TGCTACAAAC 


CTGCTTGATA 


CTATTGCAGT 


GTCAGTTGCC 


AATTGGACTG 


1020 


40 


ACGGCATCAT 


CTTAGGTCTA 


CAAAGAATAG 


GACAAGG 
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(2) INFORMATION ZU SEQ ID HO: 45: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) lANGE: 1057 Basenpaare 

(B) ART: Nukleinsaure 

(C) STHANGFOHM: Kinzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEJCttLS : Genom-DRA 



(Xl) SEQUENZBESCHREIBUNG : SEQ ID NO: 45: 





TTTACAGTTC 


TGGTTATTAT 


TTGTAAGTGT GGGGAGTGTC CCTTTTTTCT CGTCATCCTA 


60 




ACCCTTACGA 


TAAGAACCCC 


CACGATTCAC GTCGTCCATC GTGATACCCG CGTCGCCGTT 


120 


75 


GTCGCGACTG 


CCATGCCTGG 


GTGTCACATG ACTTCCCATA TCACGTTGTC GTCCTGTTGG 


180 




ACGACTCTCG 


CTATGTCCGC 


GTCGTTGTGA ACGACTCCAA TAGACATACC CCAIAATCTO 


240 




TTGAGGCTCG 


AGCGGACGTT 


CGGAATCTTT GGGAATATGT CTTAGTCGTT GCGGATTTGG 


300 


20 


ATACCCCGAC 


ATTTCCTTTT 


GATTAGACAA TGTGTAGTCA TTTTACCTTG TGTAGTACCA 


360 




GTCCTCCTAT ATTACTACTG 


TCATAAACCC TGTTGGAATG TACCGTCGTT ACCCTGGTTG 


420 




TGTATTTGTT 


ACATTCGAGG 


TAATATATAC TACTTTATGT TCGTCGTGTT CTGGTTGTCC 


480 


25 


TTTTCTTACA 


TTTTCGTAAC 


AACCTCGATC TACTTACCCG GAGAGAAACC TTAACCAAAC 


540 




TGTATTGATT 


TACCAACACC 


ATATATTTTT ATCGATATTA GTATCACCCT CGTGATTATC 


600 




CATATTCTCA 


ATAGTACTAT 


CATGAATTAG ATCACTTCTT GTAATCCGTC CCTATAGTTG 


660 


30 


GGGAGAGCAA 


CGTCTAGGGA 


CAGGGTGTGG CCGTCCTTCG TCTTTGCGGT CCTTCTTGTC 


720 




CTCTTCTTCC 


ACCTCTTCCT 


CTGTCCGGGT TCACCTGTCG GAACGGTGGT CCTAAGAACG 


780 




TTGTCAACAT 


GTGCCTAGAG 


TCCTGTTATT AGAACACCTG AATGGTGGAG AACTCGTTGA 


840 


35 


ATTATAGTCC 


CTAGGCCTCC 


GACTAGCTGA TGGACCCTGA CCCTGACACC TAGGACCCTG 


900 




TTTTCTGTTA 


ACTTCGAACA 


TCTGAAACAC CTCGACATTA CGTTATAACC GATGTTCTTA 


960 




ACTTTTTATC 


ACGATGTTTG 


GACGAACTAT GATAACGTCA CAGTCAACGG TTAACCTGAC 


1020 


40 


TGCCGTAGTA 


GAATCCAGAT 


GTTTCTTATC CTGTTCC 


1057 



45 



50 



55 
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(2) INFORMATION ZU SEQ ID NO: 46: 

(i) SEQOENZ CHARAKTERISTIKA: 

(A) UtNGE: 351 Aminosauren 

(B) ART: Aminoaaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIB: linear 

(ii) ART DES MOLEXCLS: Protein 

(v) ART DES FRAGMENTS: inn ere 3 

(xi) SEQUENZBESCHRBIBUNG: SEQ ID NO: 46: 

Met Ser Arg Pro lie lie Asn lie His Tbr Pro His Arg Ola Lye Arg 
15 10 15 

Ala val Gly Leu Gly Met Leu Phe Leu Gly Val Leu Ser Ala Ala Gly 
20 25 30 

Ser Thr Met Oly Ala Ala Ala Thr Ala Leu Tbr Val Arg Thr His Ser 

35 40 45 

Val Leu Lys Gly lie Val Gin Gin Gin Asp Asn Leu Leu Arg Ala lie 
50 55 60 

Gin Ala Gin Gin His Leu Leu Arg Leu Ser Val Trp Gly He Arg Gin 
65 70 75 80 

Leu Arg Ala Arg Leu Gin Ala Leu Glu Thr Leu He Gin Asn Gin Gin 
85 90 95 

Arg Leu Asn Leu Trp Gly Cys Lys Gly Lys Leu He cys Tyr Thr Ser 
100 105 110 

val Lys Trp Asn Thr Ser Trp Ser Gly Gly Tyr Asn Asp Asp Ser He 

115 120 125 

Trp Asp Asn Leu Thr Trp Gin Gin Trp Asp Gin His He Asn Asn Val 
130 135 140 

Ser Ser He He Tyr Asp Glu He Gin Ala Ala Gin Asp Gin Gin Glu 
145 150 155 160 

Lys Asn Val Lys Ala Leu Leu Glu Leu Asp Glu Trp Ala Ser Leu Trp 
165 170 175 

Asn Trp Phe Asp He Thr Lys Trp Leu Trp Tyr He Lys He Ala He 
180 185 190 

He He Val Gly Ala Leu He Gly He Arg Val He Met He Val Leu 
195 200 205 

Asn Leu Val Lys Asn He Arg Gin Gly Tyr Gin Pro Leu Ser Leu Gin 

210 215 220 

He Pro val Pro His Arg Gin Glu Ala Glu Thr Fro Gly Arg Thr Gly 
225 230 235 240 

Glu Glu Gly Gly Glu Gly Asp Arg Pro Lys Trp Thr Ala Leu Pro Pro 
245 250 255 

Gly Phe Leu Gin Gin Leu Tyr Thr Asp Leu Arg Thr He He Leu Trp 
260 265 270 
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Thr Tvr His Leu Leu Ser Asn Leu lie Ser Gly He Arg Arg Leu lie 
* 275 280 285 

Asp Tyr Leu Gly Leu Gly Leu Trp He Leu Gly Gin Lys Thr Tie Giu 
290 295 3&0 

Ala Cys Arg Leu Cys Gly Ala Val Met Gin Tyr Trp Leu Gin Giu Leu 
305 310 315 320 

Lvs Asn Ser Ala Thr Asn Leu Leu Asp Thr He Ala Val Ser Val Ala 
1 325 330 335 

Asn Trp Thr Asp Gly He He Leu Gly Leu Gin Arg He Gly Gin 
340 345 350 



(2) INFORMATION ZU SEQ ID NO: 47: 

(1) 3EQUENZ CHARAKTERISTIXA: 

(A) LXNGE: 22 Baa«npaar« 

(B) ART: NuXlainadura 

(C) STRANGFOHM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS: Primer 

(xi) SEQUENZBBSCHREIBUNG: SEQ ID NO: 47: 
CTAGCAGTGG CGCCCGAACA GG 22 



(2) INFORMATION FOR SEQ ID NO: 48: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 23 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(ii) MOLECULE TYPE: Primer 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 48: 
AATGAGGAAG CUGCAGAUTG GGA 23 
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(2) INFORMATION FOR SEQ ID NO: 49: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 23 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 
(0) TOPOLOGY: linear 

(ii) MOLECULE TYPE: Primer 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO 
TCCCAUTCTG CUGCTTCCTC ATT 



(2) INFORMATION ZU SEQ ID NO: 50: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 26 Baaenpaare 

(B) ART: Nukleinaaure 

(C) STRAKGFORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK&LS: Primer 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: SO: 
CCAAGGGGAA GTGACATAGC AGGAAC 



(2) INFORMATION ZD SEQ ID NO: 51: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) L&NGE: 21 Baaenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Primer 



(Xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 51: 
CGTTGTTCAG AATTCAAACC C 
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(2) INFORMATION ZU SEQ ID NO: 52: 

(1) SEQUENZ CHARACTER I ST I KA: 

(A) LANGE: 21 Basenpaare 

(B) ART: Nukleins&ura 

(C) STRANGFORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLZKOLS: Primer 



(xi) SEQOENZBESCHRE I BUNG : SEQ ID NO: 52: 
TCCCTAAAAA ATTAGCCT6T C 21 



(2) INFORMATION ZU SEQ 10 NO: S3: 

(i) SEQUENZ CHARACTERISTIXA: 

(A) LANGE: 19 Baaenpaara 

(B) ART: Ifukleinsaure 

(C) STRANG FORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Genom-DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 53: 
AAACCTCCAA TTCCCCCTA 19 



(2) INFORMATION ZU SEQ ID NO: 54: 

(i) SEQOENZ CHARACTER I ST I KA: 

(A) L&NGE: 39 Aminosauren 

(B) ART: Aminos aure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtJLS: Protein 

(v) ART DES FRAGMENTS: inneres 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 54: 

Cys He Arg Glu Gly He Ala Glu val Gin Asp He Tyr Thr Gly Pro 
15 10 15 

Met Arg Trp Arg Ser Met Thr Leu Lys Arg Ser Asn Asn Thr Ser Pro 
20 25 30 

Arg Ser Arg Val Ala Tyr Cys 
35 
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(2) INFORMATION ZU SEQ ID NO: 55: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 41 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFOKM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS: Protein 

(v) ART DES FRAGMENTS: inneres 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 55: 
Cvs He Arg Glu Gly lie Ala Glu Val Gin Asp Leu His Thr Gly Pro 



Leu Arg Trp Arg Ser Met Thr Leu Lys Lys Ser Ser Asn Ser His 
20 25 

Gin Pro Arg Ser Lys Val Ala Tyr Cys 
35 40 



40 



BP 0 591 914 A2 



(2) INFORMATION ZU SEQ ID NO: 56: 

(1) SEQUEN2 CHARAXTEHISTIKA: 

(A) LAHGE: 9793 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGPOHM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLZXOLS: Genom-DNA 



10 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 56: 





CTGGATGGGT 


TAATTTACTC 


CCATAAGAGA 


GCAGAAATCC 


TGGATCTCTG 


GATATATCAC 


60 




ACTCAGGGAT 


TCTTCCCTGA 


TTGGCAGTGT 


TACACACCGG 


GACCAGGACC 


TAGATTCCCA 


120 


75 


CTGACATTTG 


GATGGTTGTT 


XAAACTGGTA 


CCAGTGTCAG 


CAGAAGAGGC 


AGAGAGACTG 


180 




GGTAATACAA 


ATGAAGATGC 


TAGTCTTCTA 


CATCCAGCTT 


GTAATCATGG 


AGCTGAGGAT 


240 




GCACACGGGG A GAT ACT AAA ATGGCAGTTT 


GATAGATCAT 


TAGGCTTAAC 


ACATATAGCC 


300 


20 


CTGCAAAAGC 


ACCCAGAGCT 


CTTCCCCAAG 


TAACTGACAC 


TGCGGGACTT 


TCCAGACTGC 


360 




TGACACTGCG 


GGGACTTTCC 


AGCGTGGGAG 


GGATAAGGGG 


CGGTTCGGGG 


AGTGGCXAAC 


420 




CCTCAGATGC 


TGCATATAAG 


CAGCTGCTTT 


CCGCTTGTAC 


CGGGTCTTAG 


TTAGAGGACC 


460 


25 


AGGTCTGAGC 


CCGGGAGCTC 


CCTGGCCTCT 


AGCTGAACCC 


GCTGCTTAAC 


GCTCAATAAA 


540 




GCTTGCCTTG 


AGTGAGAAGC 


AGTGTGTGCT 


CATCTGTTCA 


ACCCTGGTGT 


CTAGAGATCC 


600 




CTCAGATCAC 


TTAGACTGAA 


GCAGAAAATC 


TCTAGCAGTG 


GCGCCCGAAC 


AGGGACGCGA 


660 


30 


AAGTGAAAGT 


GGAACCAGGG 


AAGAAAACCT 


CCGACGCAAC 


GGGCTCGGCT 


TAGCGGAGTG 


720 




CACCTGCTAA 


GAGGCGAGAG 


GAACTCACAA 


GAGGGTGAGT 


AAATTTGCTG 


GCGGTGGCCA 


780 




GACCTAGGGG 


AAGGGCGAAG 


TCCCTAGGGG 


AGGAAGATGG 


GTGCGAGAGC 


GTCTGTGTTG 


840 


36 


ACAGGGAGTA 


AATTGGATGC 


ATGGGAACGA 


ATTAGGTTAA 


GGCCAGGATC 


TAAAAAGGCA 


900 


TATAGGCTAA 


AACATTTAGT 


ATGGGCAAGC 


AGGGAGCTGG 


AAAGATACGC 


ATGTAATCCT 


960 




GGTCTATTAG 


AAACTGCAGA 


AGGTACTGAG 


CAACTGCTAC 


AGCAGTTAGA 


GCCAGCTCTC 


X020 




AAGACAGGGT 


CAGAGGACCT 


GAAATCTCTC 


TGGAACGCAA 


TAGCAGTACT 


CTGGTGCGTT 


1080 


40 


CACAACAGAT 


TTGACATCCG 


AGATACACAG 


CAGGCAATAC 


AAAAGTTAAA 


GGAAGTAATO 


1140 




GCAAGCAGGA 


AGTCTGCAGA 


GGCCGCTAAG 


GAAGAAACAA 


GCCCTAGGCA 


GACAAGTCAA 


1200 




AATTACCCTA 


TAGTAACAAA 


TGCACAGGGA 


CAAATGGTAC 


ATCAAGCCAT 


CTCCCCCAGG 


1260 


45 


ACTTTAAATG 


CATGGGTAAA 


GGCAGTAGAA 


GAGAAGGCCT 


TTAACCCTGA 


AATTATTCCT 


1320 




ATGTTTATGG 


CATTATCAGA 


AGGGGCTGTC 


CCCTATGATA 


TCAATACCAT 


GCTGAATGCC 


1380 




ATAGGGGGAC 


ACCAAGGGGC 


TTTACAAGTG 


TTGAAGGAAG 


TAATCAATGA 


GGAAGCAGCA 


1440 


50 


GAATGGGATA 


GAACTCATCC 


ACCAGCAATG 


GGGCCGTTAC 


CACCAGGGCA 


GATAAGGGAA 


1500 




CCAACAGGAA 


GTGACATTGC 


TGGAACAACT 


AGCACACAGC 


AAGAGCAAAT 


TATATGGACT 


1560 



41 





ACTAGAGGGG 


CTAACTCTAT 


CCCAGTAGGA 


GACATCTATA 


GAAAAXGGAT 


AGXGCtAGGA 


1620 




CTAAACAAAA 


TGGTAAAAAT 


GTACAGTCCA 


GTGAGCATCT 


TAOATATXAG 


GCAGGGACCA 


1680 


5 


AAAGAACCAT 


TCAGAGATTA 


XGXAGAXCGG 


TTTTACAAAA 


CATTAAGACC 


XGAGCAAGCT 


174C 




ACTCAAGAAG 


TAAAGAATtG 


GATGACAGAA 


ACCTTGCTTG 


XTCAGAAXXC 


AAACCCAGAX 


160G 




XGXAAACAAA 


TTCTGAAAGC 


ATTAGGACCA 


GAAGCXACTT 


tAGAAGAAAT 


GATGGZAGCC 


I860 


in 

IV 


TGTCAAGGAG 


TAGGAGGGCC 


AACTCACAAG 


GCAAAAATAC 


TAGCAGAAGC 


AATGGCTXCT 


1920 


GCCCAGCAAG 


ATTTAAAAGG 


AGGATACACA 


GCAGTATTCA 


tGCAAAGAGG 


GCAGAAICCA 


1980 




AATAGAAAAG 


GGCCCATAAA 


ATGCTTCAAT 


TGTGGAAAAG 


AGGGACATAI 


AGGAAAAAAC 


2040 




TGTCGAGCAC 


CTAOAAAAAG 


GGGTTGCTGG 


AAATGTGGAC 


AGGAAGGXCA 


CCAAATGAAA 


2100 


15 


GATTGCAAAA 


ATGGAAGACA 


GGCAAAITTT 


XTAGGGAAGX 


ACTGGCCTCC 


GGGCGGCACG 


. 2160 




AGGCCAGGCA 


ATTATGTGCA 


GAAACAAGTG 


TCCCCATCAG 


CCCCACCAAt 


GGAGGAGGCA 


2220 




GTGAAGGAAC 


AAGAGAATCA 


GAGTCAGAAG 


GGGGATCAGG 


AAGAGCTGTA 


CCCATTTGCC 


2260 


20 


tCCCTCAAAT 


CCCTCTTT GG 


GACAGACCAA 


TAGICACAGC 


AAAGGXXGGG 


GGICAICTAI 


2340 




GTGAGGCTTT 


ACTGGATACA 


GGGGCAGATG 


ATACAGTATT 


AAATAACAXA 


CAATTAGAAG 


2400 




GAAGATGGAC 


ACCAAAAATG 


AZAGGGGGTA 


TAGGAGGCTT 


IAXAAAAGXA 


AAAGAGXATA 


2460 


25 


ACAATGTGAC 


AGXAGAAGXA 


CAAGGAAAGG 


AAGTACAGGG 


AACAGXAXXG 


GTGGGACCTA 


2520 


CTCCTGTTAA 


IAIXCTTGGG 


AGAAACATAT 


TGACAGGATT 


AGGAXGTACA 


CTAAAXXXCC 


2580 




CXAIAAGXCC 


CATAGCCCCA 


GTGCCAGTAA 


AGCTAAAACC 


AGGAATGGAT 


GGACCAAAAG 


2640 




TAAAACAATG 


GCCCCTATCT 


AGAGAGAAAA 


TAGAAGCACT 


AACTGCAATA 


xgtcaagaaa' 


2700 


30 


TGGAACAGGA 


AGGAAAAATC 


TCAAGAATAG 


GACCTGAAAA 


XCCXIAIAAX 


AGACCTATTT 


2760 




TTGCTATAAA 


AAAGAAAGAT 


AGCACTAAGT 


GGAGAAAATT 


GGTAGACTTC 


AGAGAAXTAA 


2820 




ATAAAAGAAC 


ACAAGATTTC 


TGGGAGGTGC 


AATTAGGIAT 


ICCACATCCA 


GGGGGXTTAA 


2880 


35 


AGCAAAGGCA 


ATCTGTTACA 


GTCTTAGATG 


TAGGAGATGC 


XTATTICTCA 


TGCCCIXXAG 


2940 




ATCCAGACTT 


TAGAAAATAC 


ACTGCCTTCA 


CTATTCCTAG 


TGTGAACAAI 


GAGACCCCAG 


3000 




GAGTAAGATA 


CCAGTACAAT 


GTCCTCCCGC 


AAGGGTGGAA 


AGGTTCACCA 


GCCAIAIITC 


3060 


40 


AGAGTTCAAT 


GACAAAGATT 


CTAGATCCAT 


TTAGAAAAAG 


CAACCCAGAA 


GTAGAAATXT 


3120 


AICAGXACAT 


AGATGACTTA 


TATGTAGGAT 


CAGAIIIACC 


AXXGGCAGAA 


CAXAGAAAGA 


3180 




GGGTCGAATT 


GCTTAGGGAA 


CAIIXATAXC 


AGTGGGGATT 


TACTACCCCT 


GAXAAAAAGC 


3240 




ATCAGAAGGA 


ACCTCCCTTT 


TTAZGGATGG 


GATAXGAGCT 


CCACCCAGAC 


AAGTGGACAG 


3300 


45 


TACAGCCCAT 


CCAATTGCCT 


GACAAAGAAG 


TGTGGACAGT 


AAATGATAXA 


CAAAAATXAG 


3360 




TAGGAAAAII 


AAA1TGGGCA 


AGTCAAATCT 


ATCAAGGAAX 


TAGAGXAAAA 


GAATTGTGCA 


3420 




AGTTAATCAG 


AGGAACCAAA 


TCATTGACAG 


AGGTAGXACC 


TTTAAGTAAA 


GAGGCAGAAC 


3480 


50 


TAGAATTAGA 


AGAAAACAGA 


GAAAAGCXAA 


AAGAGCCAGX 


ACATGGAGXA 


XAIXACCAGC 


3540 




CTGACAAAGA 


CTTGTGGGTT 


AGTATTCAGA 


AGCAXGGAGA 


AGGGCAAXGG 


ACXTACCAGG 


3600 



55 
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TATATCAGGA XGAACAXAAG AACCTTAAAA CAGGAAAAXA TGCTAGGCAA AAGGCCTCCC 366C 

ACACAAAXGA TATAAGACAA TTGGCAGAAG TAGTCCAGAA GCTGTCTCAA GAAGCMTAG 3T2C 

XXAIAXGGGG GAAATTACCT AAAXXCAGGC TGCCAGTTAC IAGAGAAACT TGGGAAACTX 378C 

5 

GGTGGGCAGA ATATTGGCAG GCCACCTGGA TTCCTGAATG GGAAXXXGXC AGCACACCCC 3840 

CATTGAICAA AXXATGGXAC CAGXXAGAAA CAGAACCTAI TGTAGGGGCA GAAACCTTTT 3900 

AXGTAGAIGG AGCAGCTAAI AGGAAIACAA AACXAGGAAA GGCGGGATAT GTTACAQAAC 3960 

10 AAGGAAAACA GAACATAAXA AAGTTAGAAG AGACAACCAA TCAAAAGGCT GAATTAAXGG 4020 

CTGTATTAAT AGCCTTGCAG GATTCCAAGG AGCAAGtAAA CATAGTAACA GACTCACAAT 4080 

AXGTAITGGG CATCATATCC XCCCAACCAA CACAGAGTGA CTCCCCTATA GTTCAGCAGA 4140 

*5 TAATAGAGGA ACTAACAAAA AAGGAACGAG TGTATCTTAC ATGGGTTCCT GCTCACAAAG 4200 

GCATAGGAGG AAATGAAAAA ATAGATAAAT TAGTAAGCAA AGACATTAGA AGAGTCCXGX 4260 

TCCTGGAAGO AATAGATCAG GCACAAGAAG ATCAXGAAAA AXAICATAGX AATTGGAGAG 4320 

20 CATTAGCTAG XGACTTTGGA TIACCACCAA TAGTAGCCAA GGAAAXCATT GCTAGTtQTC 4380 

CTAAAXGCCA TATAAAAGGG GAAGCAACGC AXGGTCAAGT AGACTACAGC CCAGAGAXAX 4440 

GGCAAAXCGA TTGTACACAT XXAGAAGGCA AAATCAXAAT AGXTGCTGTC CATGIAGCAA 4500 

GXGACXXTAT AGAAGCAGAG GXGATACCAG CAGAAACAGG ACAGGAAACT GCCTAXXTCC 4560 

25 

XGTTAAAATT AGCAGCAAGA XGGCCXGXCA AAGXAATACA TACAGACAAI GGACCTAATT 4620 

TTACAAGXGC AGCCAXGAAA GCXGCAXGXT GGXGGACAGG CAXACAACAT GAGTTTGGGA 4680 

XACCAXAXAA XCCACAAAGX CAAGGAGXAG XAGAAGCCAX GAAXAAAGAA TTAAAAICTA 4740 

30 XTAXACAGCA GGXGAGGGAC CAAGCAGAGC AXXXAAAAAC AGCAGXACAA ATGGCAGTCX 4800 

TXGTICACAA TXTTAAAAGA AAAGGGGGGA XXGGGGGGTA CACXGCAGGG GAGAGACTAA 4860 

TAGACAXACT AGCAXCACAA AXACAAACAA CAGAACIACA AAAACAAAIX XTAAAAATCA 4920 

36 ACAAXXXXCG GGXCXAXTAC AGAGAXAGCA GAGACCCXAT XXGGAAAGGA CCGGCACAAC 4980 

XCCTGXGGAA AGGXGAGGGG GCAGTAGTCA XACAAGAXAA AGGAGACAXT AAAGTGGTAC 5040 

CAAGAAGAAA GGCAAAAAXA ATCAOAGAXX AXGGAAAACA GAIGGCAGGT ACXGAXAGXA 5100 

XGGCAAAXAG ACAGACAGAA AGXGAAAGCA TGGAACAGCC XGGTGAAAIA CCAXAAATAC 5160 

40 

ATGXCXAAGA AGGCCGCGAA CTGGCGXTAT AGGCATCAII AXGAAXCCAG GAAXCCAAAA 5220 

GXCAGXXCGG CGGXGXAXAX XCCAGXAGCA GAAGCXGAXA XAGTGGXCAC CACATAXTGG 5280 

GGAXTAAXGC CAGGGGAAAG AGAGGAACAC XtGGGACAXG GGGXXAGXAX AGAAXGGCAA 5340 

XACAAGGAGT AXAAAACACA GATTGATCCX GAAACAGCAG ACAGGAXGAX ACATCTGCAT 5400 

TATTTCACAX GXXXXACAGA ATCAGCAAXC AGGAAGGCCA XXCXAGGGCA GAGAGXGCXG 5460 

ACCAAGXGXG AAXACCXGGC AGGACAXAGX CAGGXAGGGA CACXACAAXX CTXAGCCXXG 5520 

50 AAAGCAGXAG XGAAAGXAAA AAGAAAXAAG CCXCCCCXAC CCAGXGXCCA GAGAIXAACA 5580 



55 
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GAAGAIAGAI 


GGAACAAGCC 


CXGGAAAAXC 




GGACACTAGA 


GCTCCTGGAA 


GAGCXGAAAG 


5 


GGTIACAAGC 


CTGTGGGCAG 


TACATTTATG 




TGGCAATTAT 


AAGAATCTTA 


CAACAACTAC 




AXAGTAGAAX 


AGGAATTCTC 


CCAXCXAACA 


10 


GXAGAXCCXG 


AGATGCCCCC 


XXGGCAXCAC 


AATTGCTATT 


GCAAAAGATG 


CXGCIAICAX 




GGAAXCXCCC 


ATGGCAGGAA 


GAAGCGAAGA 




AATAAAGATC 


CTGTACCAGA 


GCAGTAAGTA 


75 


IXAAIAGCXX 


XAAGTGCTTT 


GXGXCIXAXA 




ATTTATTTAG 


XGCAAAGAAA 


ACAAGAXAGA 




AGAAXAAAGG 


AAATCAGGGA 


XGACAGXGAC 


20 


GTCATGGAGC 


TTATACATAG 


CCAIGGCXIT 




ATIGTAIGCC 


ACAGXTTAXX 


CXGGGGTACC 




CTGTGCTTCA 


GATGCTAACC 


XAACAAGCAC 


25 


CTGCGTTCCT 


ACAGAXCCCA 


ATCCACATGA 




TGAIAIATGG 


AAAAAXXACA 


XGGTGGACCA 




ACAGAGTTTA 


AAGCCTTGXG 


AGAAAAXGAC 




TCTGCAAACA 


AAXAAAACAG 


GCCXAIIAAA 


30 


TTTTAATGTA 


ACTACAGXCC 


ICACAGACAA 




ATCAGATCTG 


AGTAAGGTTA 


AXGACXCAAA 




TAAIXGXAAC 


ICCACAAIIA 


XCAAGCAGGC 


35 


CATACACTAT 


TGIGCTCCAA 


CAGGATATGC 




TGGAACAGGC 


CTATGCCACA 


ATAIIXCAGI 




AGXAAGIACX 


CAACXAAXAC 


TGAAXGGGAC 


40 


AAAAAATATT 


ACAGAAXCAG 


CAAAGAAXAX 


GACCTGCAIA 


AGAGAAGGAA 


XXGCAGAGGX 




GCGCAGTATG 


ACACTTAAAA 


GAAGXAACAA 




IACAIAXAAI 


AAGACXGXAX 


GGGAAAAXGC 


45 


TCTTGTAAAC 


CAAACAGAGA 


AIGXXACCAX 




AGAAGTAAGC 


CAXTTACATT 


IIAACXGXCA 




GATGTTTAAC 


TATACTTTTA 


XCAACXGXAC 


50 


CAATGAGACC 


AAXAAAAAXG 


GXACXAXACC 




GATGAAGGGA 


GAGXCGAGAA 


XCXAIGCACC 



55 



AGGGACCAGC 


XAGGGAGCCA 


XXCAAXQAAX 


564C 


AAGAAGCAGX 


AAG&CAXXTC 


CCXAGGCCTT 


570C 


AGACXXAXGG 


AGACAGTTGC 


GAAGGAGXTA 


576C 


XGXTXACCCA 


XXAXAGAAXT 


GGAIGCCAAC 


5820 


CAAGAGGAAG 


AGGAAGAAGA 


AAXGGAXCCA 


5680 


CCXGGGAGCA 


AGCCCCAAAC 


CCCTTGXAAI 


5940 


XGCXAXGXXX 


GXXXCACAAA 


GAAGGGXTTG 


6000 


AGACCAGCAG 


CXGCXGCAAG 


CTAICCAGAX 


6060 


ACGCXGAXGC 


AICAAGAGAA 


CCXGCTAGCC 


6120 


AATGXACTTA 


IATGGXXGTT 


TAACCXTAGA 


6180 


AGGGAGCAGG 


AAAIACXIGA 


AAGATTAAGG 


6240 


TATGAAAGTA 


ATGAAGAAGA 


ACAACAGGAA 


6300 


GCTAAICCCA 


XGXTXGAGXT 


AIAGXAAACA 


6360 


IGXAXGGGAA 


GAGGCAGCAC 


CAGTACXAXT 


6420 


XGAACAGCAX 


AAXAXTTGGG 


CAXCACAAGC 


6460 


AXTXCCACXA 


GGCAAXGXGA 


CAGATAACTT 


6540 


AAXGCAXGAA 


GACATCAXTA 


GXTXGXGGGA 


6600 


IIICXXAXGX 


GXACAAAXGA 


ACXGXGTAGA 


6660 


XGAGACAATA 


AATGAGAXGA 


GAAATXGTAG 


6720 


AAAGGAGCAA 


AAACAGGCTC 


XAXXCXAXGX 


6780 


XGCAGXAAAX 


GGAACAACAX 


AXAXGXTAAC 


6840 


CXGICCGAAG 


GTAAGXTTXG 


AGCCCAXXCC 


6900 


CAICXTIAAG 


XGXAATGACA 


CAGACTTTAA 


6960 


GGXXACXXGX 


ACACAXGGCA 


XCAAGCCAAC 


7020 


ACTCXCXAGA 


GAAAAGAIAA 


GAATXAXGGG 


7080 


CAXAGXAACC 


CTAAACACTC 


CXAXAAACAX 


7140 


ACAAGATATA 


XAXACAGGTC 


CAAXGAGATG 


7200 


TACAXCACCA 


AGAXCAAGGG 


TAGCTTAXTG 


7260 


CCXACAACAA 


ACAGCTATAA 


GGXATTTAAA 


7320 


AAXAXXCAGC 


AGAACXAGXG 


GTGGAGAXGC 


7360 


TGGAGAAXXC 


XXIXAIXGXA 


ACACAICXGG 


7440 


AAAGXCCGGA 


TGCCAGGAGA 


XCAAAGGGAG 


7500 


TTGCAAGTTA 


AGACAGCXAG 


XAAGAXCAXG 


7560 


ICCCAXCCCC 


GGCAACXXAA 


CAIGXCAXXC 


7620 
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CAACATAACT 


GGAATGATTC 


TACAGTTAGA 


TCAACCATGG 


AATTCCACAG 


GTGAAAATAC 


7680 




ACTTAGACCA GTAGGGGGAG ATATGAAAGA TATATGGAGA ACTAAATTGT ACAACIACAA 


7740 


5 


AGTAGTACAG 


ATAAAACCTT 


TTAGTCTAGC ACCTACAAAA ATGTCAAGAC 


CAATAATAAA 


7800 




CATTCACACC 


CCTCACAGGG 


AAAAAAGAGC 


AGTAGGATTG 


GGAATGCTAT 


TCTTGGGGGT 


7660 




GCTAAGTGCA GCAGGTAGCA 


CTATGGGCGC 


AGCGGCAACA 


GCGCTGACGG 


tACGGACCCA 


7920 


10 


CAGTGTACTG 


AAGGGTATAG 


TGCAACAGCA 


GGACAACCTG 


CTGAGAGCGA 


TACAGGCCCA 


7980 




GCAACACTTG 


CTGAGGTTAT 


CTGTAIGGGG 


TATTAGACAA 


CTCCGAGCTC 


GCCTGCAAGC 


8040 




CTTAGAAACC 


CTTATACAGA 


ATCAGCAACG 


CCTAAACCTA 


TGGGGCTGTA AAGGAAAACT ' 


8100 


75 


AATCTGTTAC ACATCAGTAA AATGGAACAC ATCATGGTCA GGAAGATATA ATGATGACAG 


8160 


TATTTGGGAC 


AACCTTACAT 


GGCAGCAATG 


GGACCAACAC 


ATAAACAATG 


TAAGCTCCAT 


8220 




TATATATGAT 


GAAATACAAG 


CAGCACAAGA 


CCAACAGGAA 


AAGAATGTAA AAGCATTGTT 


8280 




GGAGCTAGAT 


GAATGGGCCt 


CTCTTTGGAA 


TTGGTTTGAC 


ATAACTAAAT 


GGTTGTGGTA 


8340 


20 


TATAAAAATA 


GCTATAATCA 


TAGTGGGAGC 


ACTAATAGGT 


AXAAGAGTTA 


TTATGAXAAT 


8400 




ACTTAATCTA GTGAAGAACA 


TTAGGCAGGG 


ATATCAACCC 


CTCTCGTTGC 


AGATCCCTGT 


8460 




CCCACACCGG 


CAGGAAGCAG 


AAACGCCAGG 


AAGAACAGGA 


GAAGAAGGTG 


GAGAAGGAGA 


8520 


25 


CAGGCCCAAG 


TGGACAGCCT 


TGCCACCAGG 


ATTCTTGCAA 


CAGTTGTACA 


CGGATCTCAG 


8580 




GACAATAATC 


TTGTGGACTT 


ACCACCTCTT 


GAGCAACTTA 


ATATCAGGGA 


TCCGGAGGCT 


8640 




GATCGACTAC 


CTGGGACTGG 


GACTGTGGAT 


CCTGGGACAA 


AAGACAATTG 


AAGCTTGTAG 


8700 


30 


ACTTTGTGGA 


GCTGTAATGC 


AATATTGGCT 


ACAAGAATTG 


AAAAATAGTG 


CTACAAACCT 


6760 




GCTTGATACT 


ATTGCAGTGT 


CAGTTGCCAA 


TTGGACTGAC 


GGCATCATCT 


TAGGTCTACA 


6620 




AAGAATAGGA 


CAAGGATTCC 


TTCACATCCC 


AAGAAGAATT 


AGACAAGGTG 


CAGAAAGAAT 


8880 


35 


CTTAGTGTAA 


CATGGGGAAT 


GCATGGAGCA 


AAAGCAAATT 


tGCAGGAIGG 


TCAGAAGTAA 


8940 


GAGATAGAAT 


GAGACGATCC 


TCCTCTGATC 


CTCAACAACC 


ATGTGCACCT 


GGAGTAGGAG 


9000 




CTGTCTCCAG 


GGAGTTAGCA 


ACTAGAGGGG 


GAATATCAAG 


TTCCCACACT 


CCTCAAAACA 


9060 




ATGCAGCCCT 


TGCATTCCTA GACAGCCACA 


AAGATGAGGA 


TGTAGGCTTC 


CCAGTAAGAC 


9120 


40 


CTCAAGTGCC 


TCTAAGGCCA ATGACCTTTA AAGCAGCCTT 


TGACCTCAGC 


TTCTTTTTAA 


9180 




AAGAAAAGGG 


AGGACTGGAT 


GGGXTAATTT 


ACTCCCATAA 


GAGAGCAGAA 


ATCCTGGATC 


9240 




TCTGGATATA 


TCACACTCAG 


GGATTCTTCC 


CTGATTGGCA 


GTGTTACACA 


CCGGGACCAG 


9300 


45 


GACCTAGATT 


CCCACTGACA 


TTTGGATGGT 


TGTTTAAACT 


GGTACCAGTG 


TCAGCAGAAG 


9360 




AGGCAGAGAG ACTGGGTAAT ACAAATGAAG 


ATGCTAGTCT 


TCTACAICCA 


GCTTGTAATC 


9420 




ATGGAGCTGA 


GGATGCACAC 


GGGGAGATAC 


TAAAATGGCA 


GTTTGATAGA 


TCATTAGGCT 


9480 


50 


TAACACATAT 


AGCCCTGCAA 


AAGCACCCAG 


AGCTCTTCCC 


CAAGTAACTG ACACTGCGGG 


9540 




ACTTTCCAGA 


CTGCTGACAC 


TGCGGGGACT 


TTCCAGCGTG 


GGAGGGATAA 


GGGGCGGTTC 


9600 



55 



45 



GGGGAGTGGC TAACCCTCAG ATGCTGCATA TAAGCAGCTQ CTTTCCGCTT GTACCGGGTC 966C 
TTAGTTAGAG GACCAGGTCT GAGCCCGGGA GCTCCCTGGC CTCTAGCTGA ACCCGCMCT 9720 
TAACGCTCAA TAAAGCTTGC CXTGAGTGAG AAGCAGTGTG TGCTCATCTG TtCAACCCTG 9780 

9793 

GTGTCTAGAG ATC 



15 



20 



25 



30 



35 



40 



50 



55 



46 
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(2) INFORMATION ZU SEQ ID NO: 57: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) UKGB: 1733 Baaenpaare 
s (B) ART: Nuxleinsaure 

(C) STRANGPOHM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKOLS: GanoB-DNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 57: 





AAACCTCCGA 




TCSGCTTAGC 

A ww ww * 


GGAGTGCACC 


TGCTAAGAGG 


CGAGAGGAAC 


60 




TCAlAAuAWi 




TTGCTGGCGG 


TGGCCAGACC 


TAGGGGAAGG 


GCGAAGTCCC 


120 


75 


lAuUUUAUUA 




GAGAGCGTCT 


GTGTTGACAG 


GGAGTAAATT 


GGATGCATGG 


180 




r+ » %s*rzx w^*x 




AGGATCTAAA 


AAGGCATATA 


GGCTAAAACA 


TTTAGTATGG 


240 




viUUIUUAUvU 


AGCTGGAAAG 


ATACGCATGT 


AATCCTGGTC 


XATTAGAAAC 


TGCAGAAGGT 


300 


20 


ALIuAMJIAU 


TBPTACAGCA 


GTTAGAGCCA 


GCTCTCAAGA 


CAGGGTCAGA 


GGACCTGAAA 


360 




TC TLT1 ITXVaaa 


x nrzr AATAOf 


AGTACTCTGG 


TGCGTTCACA 


ACAGATTTGA 


CATCCGAGAT 


420 






fAATAPAAAA 


GTTAAAGGAA 


GTAATGGCAA 


GCAGGAAGTC 


TGCAGAGGCC 


480 


25 


GCTAAuuAAv 




TARfirAfiACA 


AGTCAAAATT 


ACCCTATAGT 


AACAAATGCA 


540 




CAGGuACAAA 




AwlcUli w A w w 


CCCAGGACTT 


TAAATGCATG 


GGTAAAGGCA 


600 




GIAQAAuAuA 


AWAiUi A AAA 


CCCTGAAATT 


ATTCCTATGT 


TTATGGCATT 


ATCAGAAGGG* 


660 


30 


(jw4.(jXwwl*wl 


ATf3ATATCAA 


TACCATGCTG 


AATGCCATAG 


GGGGAGACCA 


AGGGGCTTXA 


720 


CAAGTGTTGA 


A RftAARTAAT 


CAATGAGGAA 

t*AftA VftWW*** 


GCAGCAGAAT 


GGGATAGAAC 


TCATCCACCA 


780 








AGGGCAGATA 


AGGGAACCAA 


GAGGAAGTGA 


CATTGCTGGA 


840 




ACAACTAGCA 


CACAGCAAGA 


GwAAAXXAXa 


IVlUAUlALIA 


(XXCIGGGCTXX 


CTCTATCCCA 


900 


35 


GTAGGAGACA 


TCTATAGAAA 


ATGGATAGTG 


CTAGGACTAA 


ACAAAATGGT 


AAAAATGTAC 


960 




AGTCCAGTGA 


GCATCTTAGA 


TATTAGGCAG 


GGACCAAAAG 


AACCATTCAG 


AGATTATGTA 


1020 




GATCGGTTTT 


ACAAAACATT 


AAGAGCTGAG 


CAAGCTACTC 


AAGAAGTAAA 


GAATTGGATG 


1080 


40 


ACAGAAACCT 


TGCTTGTTCA 


GAATTCAAAC 


CCAGATTGTA 


AACAAATTCT 


GAAAGCATTA 


1140 




GGACCAGAAG 


CTACTTTAGA 


AGAAATGATG 


GTAGCCTGTC 


AAGGAGTAGG 


AGGGCCAACT 


12G0 




CACAAGGCAA 


AAATACTAGC 


AGAAGCAATG 


GCTTCTGCCC 


AGCAAGATTT 


AAAAGGAGGA 


1260 


45 


TACACAGCAO 


TATTCATGCA 


AAGAGGGCAG 


AATCCAAATA 


GAAAAGGGCC 


CATAAAATGC 


1320 




TTCAATTGTG 


GAAAAGAGGG 


ACATATAGCA 


AAAAACTGTC 


GAGCACCTAG 


AAAAAGGGGT 


1380 




TGCTGGAAAT 


GTGGACAGGA 


AGGTCACCAA 


ATGAAAGATT 


GCAAAAATGG 


AAGACAGGCA 


1440 


50 


AATTTTTTAG 


GGAAGTACTG 


GCCTCCGGGG 


GGCACGAGGC 


CAGGCAATTA 


TGTGCAGAAA 


1500 




CAAGTGTCCC 


CATCAGCCCC 


ACCAATGGAG 


GAGGCAGTGA 


AGGAACAAGA 


GAATCAGAGT 


1560 



47 



CAGAAGGGGG ATCAGGAAGA GCTGTACCCA TTTGCCTCCC TCAAATCCCT CTTTGGGACA 1620 
GACCAATAGT CACAGCAAAG GTTGGGGGTC ATCTATGTGA GGCTJTACTC GA2ACXGGGG 1680 
CAGATGAIAC AGTATTAAAT AACATACAAT TAGAAGGAAG AXGGACACCA AAA* 1733 



48 
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(2) INFORMATION" ZU SEQ ID NO: 58: 

(i) SEQUENZ CHARACTER I ST I KA : 

(A) LXNGE: 1733 Basenpaare 
5 (B) ART: Nukleinsaure 

(C) STRANG FORM : Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKOLS: Genom-DNA 



10 

(XX) SEQUENZ BESCHRE I BUNG : SEQ ID NO: 58: 





AAACCTCCAA 


CGCAACGGGC 


TCGGCTTAGC VJuAUiltCACC 


TGCTAAGAGG 


CGAGAGGAAC 






TCACAAGAGG 


GTGAGTAAAT 


TTCjCTUGUvKj TuGuCAGACC 


TAGGGGAAGG 


GCGAAGTCCC 




T5 


TAGGGGAGGA 


AGATGGGTGC 


GAGACGGTCT GTGTTGACAG 


GGAGTAAATT 


GGATGCATGG 


i art 
ISO 




GAACGAATTA 


GGTTAAGGCC 


AGGATCTAAA AAGGCATATA 


GGCTAAAACA 


TTTAGTATGG 


240 




GCAAGCAOGG 


AGCTGGAAAG 


ATACGCATAT AATCCTGGTC 


TACTAGAAAC 


TGCAGAAGGT 


3UO 


20 


ACTGAACAAC 


TGCTACAGCA 


GT TAGAGC CA GCTCTCAAuA 


CAGGGTCAGA 


GGACCTGAAA 


t An 




TCCCTCTGGA 


ACGCAATAGC 


AuTAuXUluu IvkuIICAUl 


ACAGATTTGA 


CATCCGAGAT 


1*U 




ACACAGCAGG 


uAAXALJtAAA 




GCAGGAAGTC 


TGCAGAGGCC 


480 


26 


GCTAAGGAAG 


AAACAAGwXC 


AAuuU&uuCA Aul UUU1A1I 


ACCCTATAGT 


AACAAATGCA 


3%U 




CAGGGACAAA 


TGGTACATCA 


AGCCATATCC CCTAGGACTT 


TAAATGCATG 


GGTAAAGGCA 


600 




GTAGAAGAAA 


AGGCCTTTAA 


CCCTGAAATT ATTCCTATGT 


TTATGGCATT ATCAGAAGGG 


660 


30 


GCTGTCCCCT 


ATGATATCAA 


TACCATGCTG AATGCCATAG 


GGGGACACCA AGGGGCTTTA 


720 




CAAGTGTTGA 


AGGAAGTAAT 


CAATGAGGAA GCAGCAGATT 


GGGATAGAAC 


TCATCCACCA 


780 




GCAATGGGGC 


CGTTACCACC 


AGGGCAGATA AGGGAACCAA 


CAGGAAGTGA 


CATTGCTGGA 


840 


36 


ACAACTAGCA 


CACAGCAAGA 


GCAAATTATA TGGACTACTA 


GAGGGGCTAA 


CTCTATCCCA 


900 


GTAGGAGACA 


TCTATAGAAA 


ATGGATAGTG TTAGGACTAA 


ACAAAATGGT AAAAATGTAC 


960 




AGTCCAGTGA 


GCATCTTAGA 


TATTAGGCAG GGACCAAAAG 


AACCATTCAG AGATTATGTA 


1020 




GATCGGTTTT 


ACAAAACATT 


AAGAGCTGAG CAAGCTACTC 


AAGAAGTAAA 


GAATTGGATG 


1080 


40 


ACAGAAACCC 


TCGTTGTTCA 


GAATTCAAAC CCAGATTGTA 


AACAAATTCT 


GAAAGCATTA 


1140 




GGACCAGGAG 


CTACTTTAGA 


AGAAATGATG GTAGCCTGTC 


AAGGAGTAGG AGGGCCAACT 


1200 




CACAAGGCAA 


AAATACTAGC 


AGAAGCAATG GCTTCTGCCC 


AGCAAGATTT 


AAAGGGAGGA 


1260 


45 


TACACAGCAG 


TATTCATGCA 


AAGAGGGCAG AATCCAAATA 


GAAAAGGGCC 


TATAAAATGT 


1320 




TTCAATTGTG 


GAAAAGAGGG 


ACATATAGCA AAAAACTGTC 


GAGCACCTAG AAGAAGGGGT 


1380 




TACTGGAAAT 


GTGGACAGGA 


AGGTCACCAA ATGAAAGATT 


GCAAAAATGG AAGACAGGCT 


1440 


SO 


ATTTTTTTAG 


GGAAGTACTG 


GCCTCCGGGG GGCACGAGGC 


CAGCCAATTA 


TGTGCAGAAA 


1500 




CAAGTGTCCC 


CATCAGCCCC 


ACCAATGGAG GAGGCAGTGA 


AGGAACAAGA 


GAATCAGAAT 


1560 



55 
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CAAAAGGGGG ATCAGGAAGA CCTGTACCCA TTTGCCTCCC TCAAATCCCT CTTTGGGACA 
GACCAATAGT CACAGCAAAG GTTGGGGGCC ATCTATGTGA GGCTTTACTS GATACAGGGG 
CAGATGATAC AGTATTAAAT AACATACAAT TAGAAGGAAG ATGGAGACGC AAA 



(2) INFORMATION ZO SEQ ID NO: 59: 

w (i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 496 Aminosauren 

(B) ART; Aainosaure 

(C) STRANGFORH: Einzel 

(D) TOPOLOGIB: linear 

(ii) ART DES MOLEKBLS: Protein 

(v) ART DES FRAGMENTS: inner es 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 59: 

Met Gly Ala Arg Ala Ser Val Leu Thr Gly Ser Lys Leu Asp A£r Trp 
15 10 15 

Glu Arg He Arg Leu Arg Pro Gly Ser Lys Lys Ala Tyr Arg Leu Lys 
20 25 30 

His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Tyr Ala Cys Asn Pro 
35 40 45 

Gly Leu Leu Glu Thr Ala Glu Gly Thr Glu Gin Leu Leu Gin Gin Leu 
50 55 60 

Glu Pro Ala Leu Lys Thr Gly Ser Glu Asp Leu Lys Ser Leu Trp Asn 
65 70 75 80 

Ala lie Ala Val Leu Trp Cys val His Asn Arg Phe Asp He Arg Asp 
85 90 95 

Thr Gin Gin Ala He Gin Lys Leu Lys Glu Val Met Ala Ser Arg Lys 
100 105 110 

Ser Ala Glu Ala Ala Lys Glu Glu Thr Ser Pro Arg Gin Thr Ser Gin 
115 120 125 

Asn Tvr Pro He Val Thr Asn Ala Gin Gly Gin Met Val His Gin Ala 
130 135 1*0 

He Ser Pro Arg Thr Leu Asn Ala Trp val Lys Ala Val Glu Glu Lys 
145 150 155 ISO 

Ala Phe Asn Pro Glu He lie Pro Met Phe Met Ala Leu Ser Glu Gly 
165 170 1'5 

* Ala Val Pro Tyr Asp He Aan Thr Met Leu Asn Ala He Gly Gly His 

180 185 190 

Gin Gly Ala Leu Gin Val Leu Lys Glu Val lie Asn Glu Glu Ala Ala 
195 200 205 

50 Glu Trp Asp Arg Thr His Pro Pro Ala Met Gly Pro Leu Pro Pro Gly 

210 215 220 

Gin He Arg Glu Pro Thr Gly Ser Asp He Ala Gly Thr Thr Ser Thr 
225 230 235 

Gin Gin Glu Gin lie He Trp Thr Thr Arg Gly Ala Asn Ser He Pro 

55 245 250 * 33 



J5 



20 



25 



30 



35 



40 



245 

260 



val Gly Asp lie Tyr Arg Lys Trp lie Val Leu Gly Leu Asn Lys Met 
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Val Lys Met Tyr Ser Pro 
275 

Lys Glu Pro Phe Arg Asp 
290 

Ala Glu Gin Ala Thr Gin 
305 310 

Leu Val Gin Asn Ser Asn 
325 

Gly Pro Glu Ala Thr Leu 
340 

Gly Gly Pro Thr His Lys 
355 

Ala Gin Gin Asp Leu Lys 
370 

Gly Gin Asn Pro Asn Arg 
385 390 

Lys Glu Gly His He Ala 
405 

Cys Trp Lys Cys Gly Gin 
420 

Gly Arg Gin Ala Asn Phe 
435 

Arg Pro Gly Asn Tyr Val 
450 

Met Glu Glu Ala Val Lys 
465 470 

Gin Glu Glu Leu Tyr Pro 
485 



Val Ser He Leu Asp He Arg Gin Gly Pro 
280 285 

Tyr Val Asp Arg Phe Eyr Lys Thr Ceu Arc* 
295 300 

Glu Val Lys Asn Trp Met Thr Glu Thr Leu 
315 320 

Pro Asp Cys Lys Gin He Leu Lys Ala Leu 
330 335 

Glu Glu Met Met Val Ala Cys Gin Gly Val 
345 350 

Ala Lys He Leu Ala Glu Ala Met Ala Ser 
360 365 

Gly Gly Tyr Thr Ala Val Phe Met Gin Arg 
375 380 

Lys Gly Pro He Lys Cys Phe Asn Cys Gly 
395 400 

Lys Asn Cys Arg Ala Pro Arg Lys Arg Gly 
410 415 

Glu Gly His Gin Met Lys Asp Cys Lys Asn 
425 430 

Leu Gly Lys Tyr Trp Pro Pro Gly Gly Thr 
440 445 

Gin Lys Gin Val Ser Pro Ser Ala Pro Pro 
455 460 

Glu Gin Glu Asn Gin Ser Gin Lys Gly Asp 
475 480 

Phe Ala Ser Leu Lys Ser Leu Phe Gly Thr 
490 495 



Asp Gin 
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(2) INFORMATION ZU SEQ ID NO: 60: 

(i) SBQUENZ CHARACTER I ST I KA: 

(A) LANGS: 498 Aainosauren 

(B) ART: Aminoaaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKttLS : Protein 

(v) ART DBS FRAGMENTS: inneres 
(zi) SEQUENZBESCHREIBUNG: SEQ ID NO: 60: 

Met Gly Ala Arg Arg Ser Val Leu Thr Gly Ser Lya Leu Asp Ala Trp 

1.5 10 15 

Glu Arg He Arg Leu Arg Pro Gly Ser Lys Lys Ala Tyr Arg Leu Lya 
20 25 30 

His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Tyr Ala Tyr Asn Pro 
35 40 45 

Gly Leu Leu Glu Thr Ala Glu Gly Thr Glu Gin Leu Leu Gin Gin- Leu 
'50 55 60 

Glu Pro Ala Leu Lya Thr Gly Ser Glu Asp Leu Lya Ser Leu Trp Asn 
65 70 75 SO 

Ala He Ala val Leu Trp Cys Val His Asn Arg Phe Asp He Arg Asp 
85 90 95 

Thr Gin Gin Ala He Gin Lys Leu Lys Glu Val Met Ala Ser Arg Lya 
100 105 110 

Ser Ala Glu Ala Ala Lys Glu Glu Thr Ser Ser Thr Gin Ala Ser Gin 
115 120 125 

Asn Tyr Pro He Val Thr Asn Ala Gin Gly Gin Met Val Hia Gin Ala 
130 135 140 

He Ser Pro Arg Thr Leu Aan Ala Trp Val Lys Ala Val Glu Glu Lys 
145 150 155 160 

Ala Phe Aan Pro Glu He He Pro Met Phe Met Ala Leu Ser Glu Gly 

165 170 175 

Ala val Pro Tyr Asp He Asn Thr Met Leu Asn Ala He Gly Gly His 
180 135 i90 

40 Gin Gly Ala Leu Gin Val Leu Lya Glu Val He Asn Glu Glu Ala Ala 

195 200 205 

Asp Trp Asp Arg Thr His Pro Pro Ala Met Gly Pro Leu Pro Pro Gly 
210 215 220 

45 Gin He Arg Glu Pro Thr Gly Ser Asp He Ala Gly Thr Thr Ser Thr 

225 230 235 240 

Gin Gin Glu Gin He He Trp Thr Thr Arg Gly Ala Asn Ser He Pro 
245 250 255 

val Gly Asp He Tyr Arg Lys Trp lie Val Leu Gly Leu Asn Lys Met 



10 



75 



20 



25 



30 



35 



50 



260 



55 
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val Lys Mat Tyr Ser Pro Val Ser He Leu Asp He Arg Gin Gly Pro 
275 280 285 

Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Pbe Tyr Lys Thr Leu Arg 
290 295 300 

Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr Glu Thr Leu 
305 310 315 320 

Val Val Gin Asn Ser Asn Pro Asp Cys Lys Gin He Leu Lys Ala Leu 
325 330 335 

Gly Pro Gly Ala Thr Leu Glu Glu Met Met Val Ala Cys Gin Gly Val 
340 345 350 

Gly Gly Pro Thr His Lys Ala Lys He Leu Ala Glu Ala Met Ala Ser 
355 360 365 

Ala Gin Gin Asp Leu Lys Gly Gly Tyr Thr Ala Val Phe Met Gin Arg 
370 375 380 

Gly Gin Asn Pro Asn Arg Lys Gly Pro He Lys Cys Phe Asn Cys Gly 
385 390 395 400 

Lys Glu Gly His He Ala Lys Asn Cys Arg Ala Pro Arg Arg Arg Gly 
405 410 415 

Tyr Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn 
420 425 430 

Gly Arg Gin Ala Asn Phe Leu Gly Lys Tyr Trp Pro Pro Gly Gly Thr 
435 440 445 

Arg Pro Ala Asn Tyr Val Gin Lys Gin Val Ser Pro Ser Ala Pro Pro 
450 455 460 

i 

Met Glu Glu Ala Val Lys Glu Gin Glu Asn Gin Asn Gin Lys . Gly Asp 
465 470 475 480 

Gin Glu Glu Leu Tyr Pro Phe Ala Ser Leu Lys Ser Leu Phe Gly Thr 
485 490 495 

Asp Gin 



Patentansprtiche 

1. Immunschwache- Virus der HlV-Gruppe Oder Varianten dieses Virus, das die wesentlichen morphologi- 
schen und immunologischen Eigenschaften des bei der European Collection of Animal Cell Cultures 
(ECACC) unter der Nr. V 920 92 318 hinterlegten Retrovirus mit der Bezeichnung MVP-5180/91 
aufweist. 

2. Immunschwache-Virus nach Anspruch 1, dadurch gekennzeichnet dafi es eine der Reversen Transkrip- 
tase entsprechende Proteinbande im Western Blot aufweist, die 3-7 Kilodatton kleiner ist als die 
entsprechende Bande der Viren HIV-1 und/oder HIV-2, 

a Immunschwache-Virus nach einem der AnsprUche 1 oder 2, dadurch gekennzeichnet, daB dieses 
Retrovirus mit einem gegen das Protein p 24 gerichteten monoklonalen AntikSrper weniger ReaktivitSt 
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15 



aufweist, bezogen auf die Reverse Transkriptase-AktivitSt als das Virus HIV-1 und mehr Aktivitat 
bezogen auf die Aktivitat der Reversen Transkriptase. als HIV-2. 

4. Immunschwache-Virus nach einem der vorhergehenden AnsprOche, dadurch gekennzeichnet, dafl mit 
5 seinem Transmembranprotein gp 41 Antigen-Antik8rperreaktionen gut nachweisbar sind mit Seren von 

aus Afrika stammenden Patienten und, daB m'rt dem gp 41 nur eine geringer oder keine Antigen- 
AntikSrperreaktion mit Seren von aus Deutschland stammenden Patienten nachgewiesen werden kann. 

5. Immunschwache-Virus nach einem der obengenannten AnsprOche, dadurch gekennzeichnet. daB es 
w eine RNA-Sequenz aufweist, die mit der RNA des hinterlegten Virus zu etwa 75 % oder mehr, bezogen 

auf das Gesamtgenom, homolog ist 

6. Immunschwache-Virus nach einem der oben genannten AnsprOche, dadurch gekennzeichnet. daB es 
eine RNA-Sequenz aufweist die zu der RNA-Sequenz von Tabelle 1 zu wenigstens 75 % homolog ist. 

7. Immunschwache-Virus nach einem der AnsprOche 1 bis 5, dadurch gekennzeichnet. daB es eine 
Nucleotid-Sequenz aufweist die zu der Sequenz von Tabelle 3 oder Teilen davon zu wenigstens 75 % 
homolog ist. 

m a Immunschwache-Virus nach Anspruch 7 f dadurch gekennzeichnet daB der Tell der Sequenz wenig- 
stens 50 Nucleotide tang ist 

9. Immunschwache-Virus nach einem der vorhergehenden AnsprOche. dadurch gekennzeichnet, daB es 
eine Sequenz oder Teilsequenz aufweist die der Fig. 4 entspricht oder zu dieser Sequenz homolog 1st 

25 wobei die Unterschiede zu der in Fig, 4 angegebenen Sequenz bezogen auf die Genorte hOchstens 
betragen: LTR: 17 %, GAG: 29 %; POL 25 %; VIF: 31 %; ENV: 46 %; NEF: 16 %. 

10. Immunschwache-Vlrus nach einem der vorhergehenden AnsprOche. dadurch gekennzeichnet daB es 
eine Sequenz oder Teilsequenz aufweist, die der Fig. 4 entspricht oder zu dieser Sequenz homolog ist 

30 wobei die Unterschiede zu der in Fig. 4 angegebenen Sequenz bezogen auf die Genorte hfichstens 
betragen: LTR: 10 %; GAG: 14 %; POL 12 %; VIF: 15 %; ENV: 22 %; NEF: 10 %. 

11. cDNA, die komplementSr ist zu der RNA oder Teilen davon, des bei der European Collection of Animal 
Cell Cultures (ECACC) unter der Nr. V 920 92 318 hinterlegten Immunschwache-Virus MVP-51 80/91 

35 oder eines Virus gem3B einem der AnsprOche 1-10. 

12. Rekombinante DNA, dadurch gekennzeichnet, daB sie cDNA gemSB Anspruch 11 enthait 

13. Antigen, das unter Verwendung der cDNA gemSB Anspruch 11 oder der rekombinanten DNA gemSB 
40 Anspruch 12 hergestellt wurde oder unter Verwendung der AminosSiurenstruktur, die aus seiner cDNA 

abgeteitet werden kann. 

14. Antigen nach Anspruch 13, dadurch gekennzeichnet. daB es ein Protein oder Peptid ist. 

45 15. Antigen nach einem der AnsprOche 13 oder 14, dadurch gekennzeichnet dafl es eine Aminos^urese- 
quenz aufweist. die der Tabelle 3 oder einer Teilsequenz davon entspricht 

16. Antigen nach Anspruch 15. dadurch gekennzeichnet. daB die Teilsequenz wenigstens 10 AminosSuren 
aufweist. 

50 

17. Antigen nach Anspruch 15, dadurch gekennzeichnet daB es die Aminosauresequenz RLQALET- 
LIQNQQRLNLWGCKGKUCYTSVKWNTS oder eine Teilsequenz davon mit wenigstens 6 aufeinanderfol- 
genden Aminos£uren aufweist. 

55 1fc Antigen, das aus einem Immunschwache-Virus gemaB einem der AnsprOche 1 bis 10 hergestellt wurde. 

19. Antigen nach einem der AnsprOche 13 bis 18, dadurch gekennzeichnet daB es rekombinant hergestellt 
wurde. 
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20. Antigen nach einem der AnsprOche 13 bis 17, dadurch gekennzeichnet daB as synthetisch hergestellt 
wurde. 

21- Testkit zum Nachweis von AntikSrpem gegen Immunschwache verursachende Viren, dadurch gekenn- 
5 zeichnet. daB Antigen gemSB den AnsprUchen 13 bis 20 eingesetzt wird. 

22. Testkit gem£B Anspruch 21, dadurch gekennzeichnet, dafi es ein Western Blot ist 

2a Testkit gema*8 Anspruch 21 , dadurch gekennzeichnet daB es ein EUSA-Test ist Oder ein Fluoreszenz- 
10 Antik8rper Nachweistest ist 

24. Verwendung des Immunscrmache- Virus gemSB einem der AnsprOche 1 bis 10 und/oder der cDNA 
gemSB Anspruch 11 Oder 12 und/oder eines Antigens gemSB den AnsprQchen 13 bis 20 zum Nachweis 
von Retroviren, die Immunschwache verursachen. 

75 

26. Verwendung eines Retrovirus nach einem der AnsprOche 1 bis 10, einer cDNA gemfiB Anspruch 11 
oder 12 und/oder eines Antigens gemfiB den AnsprQchen 13 bis 20 zur Hersteilung von Impfstoffen. 

26. Ribonukleinslure, dadurch gekennzeichnet daB sie fUr ein Immunschwache-Virus nach einem der 
20 AnsprOche 1 bis 10 kodiert *™' 
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Fig. 4: Sequenz von MvP 5180 



1 


CTGGATGGGT 


TAATTTACTC 


51 


GATATATCAC 


ACTCAGGGAT 


101 


GACCAGGACC 


TAGATTCCCA 


151 


CCAGTGTCAG 


CAGAAGAGGC 


201 


TAGTCTTCTA 


CATCCAGCTT 


251 


AGATACTAAA 


ATGGCAGTTT 


301 


CTGCAAAAGC 


ACCCAGAGCT 


351 


TCCAGACTGC 


TGACACTGCG 


401 


CGGTTCGGGG 


AGTGGCTAAC 


451 


CCGCTTGTAC 


CGGGTCTTAG 


501 


CCTGGCCTCT 


AGCTGAACCC 


551 


AGTGAGAAGC 


AGTGTGTGCT 


601 


CTCAGATCAC 


TTAGACTGAA 


651 


AGGGACGCGA 


AAGTGAAAGT 


701 


GGGCTCGGCT 


TAGCGGAGTG 


751 


GAGGGTGAGT 


AAATTTGCTG 


QA1 




AGGAA GAT GG 


AS 1 

Oj i. 


AATTGGATGC 


ATGGGAACGA 


901 


TATAGGCTAA 


AACATTTAGT 


951 


ATGTAATCCT 


GGTCTATTAG 


1001 


AGCAGTTAGA 


GCCAGCTCTC 


1051 


TGGAACGCAA 


TAGCAGTACT 


1101 


AGATACACAG 


CAGGCAATAC 


1151 


AGTCTGCAGA 


GGCCGCTAAG 


1201 


AATTACCCTA 


TAGTAACAAA 



(Sequ. ID No. 56) 

CCATAAGAGA GCAGAAATCC TGGATCTCTG 
TCTTCCCTGA TTGGCAGTGX TACACACCGG 
CTGACATTTG GATGGTTGTT TAAACTGGTA 
AGAGAGACTG GGTAATACAA ATGAAGATGC 
GTAATCATGG AGCTGAGGAT GCACACGGGG 
GAXAGATCAT TAGGCTTAAC ACATATAGCC 
CTTCCCCAAG TAACTGACAC TGCGGGACTT 
GGGACTTTCC AGCGTGGGAG GGATAAGGGG 
CCTCAGATGC TGCATATAAG CAGCTGCTTT 
TTAGAGGACC AGGTCTGAGC CCGGGAGCTC 
GCTGCTTAAC GCTCAATAAA GCTTGCCTTG 
CATCTGTTCA ACCCTGGTGT CTAGAGATCC 
GCAGAAAATC TCTAGCAGTG GCGCCCGAAC 
GGAACCAGGG AAGAAAACCT CCGACGCAAC 
CACCTGCTAA GAGGCGAGAG GAACTCACAA 
GCGGTGGCCA GACCTAGGGG AAGGGCGAAG 
GTGCGAGAGC GTCTGTGTTG ACAGGGAGTA 
ATTAGGTTAA GGCCAGGATC TAAAAAGGCA 
ATGGGCAAGC AGGGAGCTGG AAAGATACGC 
AAACTGCAGA AGGTACTGAG CAACTGCTAC 
AAGACAGGGT CAGAGGACCT GAAATCTCTC 
CTGGTGCGTT CACAACAGAT TTGACATCCG 
AAAAGTTAAA GGAAGTAATG GCAAGCAGGA 
GAAGAAACAA GCCCTAGGCA GACAAGTCAA 
TGCACAGGGA CAAATGGTAC ATCAAGCCAT 
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1 *3 C 1 

lZDl 


CTCCCCCAGG ACTTTAAATG 


1301 


TTAACCCTGA AATTATTCCT 


13 51 


CCCTATGATA 


TCAATACCAT 


1401 


TTTACAAGTG 


TTGAAGGAAG 


4 J CI 


GAACTCATCC 


ACCAGCAATG 


1301 


CCAACAGGAA 


GTGACATTGC 


1551 


TATATGGACT 


ACTAGAGGGG 


1601 


GAAAATGGAT 


AGTGCTAGGA 


1651 


GTGAGCATCT 


TAGATATTAG 


1701 


TGTAGATCGG 


TTTTACAAAA 


1751 


TAAAGAATTG 


GATGACAGAA 


1801 


TGTAAACAAA 


TTCTGAAAGC 


1851 


GATGGTAGCC 


TGTCAAGGAG 


1901 


TAGCAGAAGC 


AATGGCTTCT 


1951 


GCAGTATTCA 


TGCAAAGAGG 


2001 


ATGCTTCAAT 


TGTGGAAAAG 


2051 


PTAfiAAAAAG 


GGGTTGCTGG 


2101 




ATGGAAGACA 


2151 




AGGCCAGGCA 


2201 




GGAGGAGGCA 


2251 


rtfTHGATCAGG 

UuUUA X WAWW 


AAGAGCTGTA 


2301 


GACAGACCAA 


TAGTCACAGC 


2351 


ACTGGATACA 


GGGGCAuATU 


2401 


GAAGATGGAC 


ACCAAAAATG 


2451 


AAAGAGTATA 


ACAATGTGAC 


2501 


AACAGTATTG 


GTGGGACCTA 


2551 


TGACAGGATT 


AGGATGTACA 



CATGGGTAAA GGCAGTAGAA GAGAAGGCCT 
ATGTTTATGG CATTATCAGA AGGGGCTGTC 
GCTGAATGCC ATAGGGGGAC ACCAAGGGGC 
TAATCAATGA GGAAGCAGCA GAATGGGATA 
GGGCCGTTAC CACCAGGGCA GATAAGGGAA 
TGGAACAACT AGCACACAGC AAGAGCAAAT 
CTAACTCTAT CCCAGTAGGA GACATCTATA 
CTAAACAAAA TGGTAAAAAT GTACAGTCCA 
GCAGGGACCA AAAGAACCAT TCAGAGATTA 
CATTAAGAGC TGAGCAAGCT ACTCAAGAAG 
ACCTTGCTTG TTCAGAATTC AAACCCAGAT 
ATTAGGACCA GAAGCTACTT TAGAAGAAAT 
TAGGAGGGCC AACTCACAAG GCAAAAATAC 
GCCCAGCAAG ATTTAAAAGG AGGATACACA 
GCAGAATCCA AATAGAAAAG GGCCCATAAA 
AGGGACATAT AGCAAAAAAC TGTCGAGCAC 
AAATGTGGAC AGGAAGGTCA CCAAATGAAA 
GGCAAATTTT TTAGGGAAGT ACTGGCCTCC 
ATTATGTGCA GAAACAAGTG TCCCCATCAG 
GTGAAGGAAC AAGAGAATCA GAGTCAGAAG 
CCCATTTGCC TCCCTCAAAT CCCTCTTTGG 
AAAGGTTGGG GGTCATCTAT GTGAGGCTTT 
ATACAGTATT AAATAACATA CAATTAGAAG 
ATAGGGGGTA TAGGAGGCTT TATAAAAGTA 
AGTAGAAGTA CAAGGAAAGG AAGTACAGGG 
CTCCTGTTAA TATTCTTGGG AGAAACATAT 
CTAAATTTCC CTATAAGTCC CATAGCCCCA 
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2601 


GTGCCAGTAA 


AGCTAAAACC 


AGGAATGGAT 


GGACCAAAAG 


TAAAACAATG 


2651 


GCCCCTATCT 


AGAGAGAAAA 


TAGAAGCACT 


AACTGCAATA 


TGTCAAGAAA 


2701 


TGGAACAGGA 


AGGAAAAATC 


TCAAGAATAG 


GACCTGAAAA 


TCCTTATAAT 


2751 


ACACCTATTT 


TTGCXATAAA 


AAAGAAAGAT 


AGCACTAAGT 


GGAGAAAATT 


2801 


GGTAGACTTC 


AGAGAATTAA 


ATAAAAGAAC 


ACAAGATTTC 


TGGGAGGTGC 


2351 


AATTAGGTAT 


TCCACATCCA 


GGGGGTTTAA 


AGCAAAGGCA 


ATCTGTTACA 


2901 


GTCTTAGATG 


TAGGAGATGC 


TTATTTCTCA 


TGCCCTTTAG 


ATCCAGACTT 


it -7 mJ X 


TAGAAAATAC 


ACTGCCTTCA 


CTATTCCTAG 


TGTGAACAAT 


GAGACCCCAG 


jUUX 


ft A RTAA RATA 


rrvAGTACAAT 


GTCCTCCCGC 


AAGGGTGGAA 


AGGTTCACCA 


IftCI 


RPPATATTTC 


AGAGTTCAAT 


GACAAAGATT 


CTAGATCCAT 


TTAGAAAAAG 




pa APPrLAGAA 


GTAGAAATTT 


ATCAGTACAT 


AGATGACTTA 


TATGTAGGAT 


J JL ^ X 


PAGATTTACC 


ATTGGCAGAA 


CATAGAAAGA 


GGGTCGAATT 


GCXTAGGGAA 


W A* W X 


CATTTATATC 


AGTGGGGATT 


TACTACCCCT 


GATAAAAAGC 


ATCAGAAGGA 


•J £t J X 


ACCTCCCTTT 

t\ V-r A V«» V» ^ A ^ 


TTATGGATGG 


GATATGAGCT 


CCACCCAGAC 


AAGTGGACAG 


J Jul 


TArAGPPnAT 


CCAATTGCCT 


GACAAAGAAG 


TGTGGACAGT 


AAATGATATA 


7 5 1 


TAAAAATTAG 

WuUiAAl 1AVJ 


TAGGAAAATT 


AAATTGGGCA 


AGTCAAATCT 


ATCAAGGAAT 


J4U x 


«r» » * /~"T* A A A A 
I AUAu 1AAAA 


m ATTnTHPA 
u aA iiUJiu ^»rt 


AGTTAATCAG 


AGGAACCAAA 


TCATTGACAG 


J4D x 




TTTAAGTAAA 


GAGGCAGAAC 


TAGAATTAGA 


AGAAAACAGA 


3 50 1 




nnuAULLAu x 


AGATGGAGTA 


TATTACCAGC 


CTGACAAAGA 


3551 


CTTGTGGGTT 


AulAl ILAuA 


AGPATGGAGA 


AGGGCAATGG 


ACTTACCAGG 


JoUl 


1 A 1 A 1 U AVjUA 


TflA APATAAG 


AACGTTAAAA 


CAGGAAAATA 


TGCTAGGCAA 


JODx 


A A crT'cvccr* 
AALjVjCU X 


APAPAAATGA 


TATAAGACAA 


TTGGCAGAAG 


TAGTCCAGAA 


3701 


GGTGTCTCAA 


GAAGCTATAG 


TTATATGGGG 


GAAATTACCT 


AAAx 1 UiuuL 


3751 


TGCCAGTTAC 


TAGAGAAACT 


TGGGAAACTT 


GGTGGGCAGA 


ATATTGGCAG 


3801 


GCCACCTGGA 


TTCCTGAATG 


GGAATTTGTC 


AGCACACCCC 


CATTGATCAA 


3851 


ATTATGGTAC 


CAGTTAGAAA 


CAGAACCTAT 


TGTAGGGGCA 


GAAACCTTTT 


3901 


ATGTAGATGG 


AGCAGCTAAT 


AGCAATACAA 


AACTAGGAAA 


GGCGGGATAT 
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3951 


GTTACAGAAC AAGGAAAACA GAACATAATA AAGTTAGAAG AGACAACCAA 


4001 


TCAAAAGGCT 


GAATTAATGG 


CTGTATTAAT AGCCTTGCAG GATTCCAAGG 


4051 


AGCAAGTAAA 


CATAGTAACA 


GACTCACAAT ATGTATTGGG CATCATATCC 


4101 


TCCCAACCAA 


CACAGAGTGA 


CTCCCCTATA GTTCAGCAGA TAATAGAGGA 


4151 


ACTAACAAAA AAGGAACGAG 


TGTATCTTAC ATGGGTTCCT GCTCACAAAG 


4201 


GCATAGGAGG 


AAATGAAAAA 


ATAGATAAAT TAGTAAGCAA AGACATTAGA 


4251 


AGAGTCCTGT 


TCCTGGAAGG 


AATAGATCAG GCACAAGAAG ATCATGAAAA 


4301 


ATATCATAGT 


AATTGGAGAG 


CATTAGCTAG TGACTTTGGA TTACCACCAA 


4351 


TAGTAGCCAA 


GGAAATCATT 


GCTAGTTGTC CTAAATGCCA TATAAAAGGG 


4401 


GAAGCAACGC 


ATGGTCAAGT 


AGACTACAGC CCAGAGATAT GGCAAATGGA 


4451 


TTGTACACAT 


TTAGAAGGCA 


AAATCATAAT AGTTGCTGTC CATGTAGCAA 


4501 


GTGACTTTAT AGAAGCAGAG 


GTGATACCAG CAGAAACAGG ACAGGAAACT 


4551 


GCCTATTTCC 


TGTTAAAATT 


AGCAGCAAGA TGGCCTGTCA AAGTAATACA 


460 1 


TACAGACAAT 


GGACCTAATT 


TTACAAGTGC AGCCATGAAA GCTGCATGTT 


4651 


GGTGGACAGG 


CATACAACAT 


GAGTTTGGGA TACCATATAA TCCACAAAGT 


4701 


CAAGGAGTAG 


TAGAAGCCAT 


GAATAAAGAA TTAAAATCTA TTATACAGCA 


4751 


GGTGAGGGAC 


CAAGCAGAGC 


ATTTAAAAAC AGCAGTACAA ATGGCAGTCT 




TTGTTCACAA 


TTTTAAAAGA 


AAAGGGGGGA TTGGGGGGTA CACTGCAGGG 




GAGAGACTAA 


TAGACATACT 


AGCATCACAA ATACAAACAA CAGAACTACA 




AAAACAAATT 


TTAAAAATCA 


ACAATTTTCG GGTCTATTAC AGAGATAGCA 


AQS 1 


GAGACCCTAT 


TTGGAAAGGA 


CCGGCACAAC TCCTGTGGAA AGGTGAGGGG 


com 


GCAGTAGTCA 


TACAAGATAA 


AGGAGACATT AAAGTGGTAC CAAGAAGAAA 


jUji 


GGCAAAAATA ATCAGAGATT 


ATGGAAAACA GATGGCAGGT ACTGATAGTA 




TGGCAAATAG 


ACAGACAGAA 


AGTGAAAGCA TGGAACAGCC TGGTGAAATA 




CCATAAATAC 


ATGTCTAAGA 


AGGCCGCGAA CTGGCGTTAT AGGCATCATT 


5201 


ATGAATCCAG 


GAATCCAAAA 


GTCAGTTCGG CGGTGTATAT TCCAGTAGCA 


5251 


GAAGCTGATA 


TAGTGGTCAC 


CACATATTGG GGATTAATGC CAGGGGAAAG 
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J Jvl 


AfTAHHAAPAP 




GGGTTAGTAT 


AGAATGGCAA 


TACAAGGAGT 


3 J 3 1 


ATA A A APAPA 


rtATTftATPPT 




ACAGGATGAT 


ACATCTGCAT 


540 1 


TATxxCACAT 




it firpi atp 

A 1 UALl-AA X U 


auuaa vw« L-A 


XXL IAOUuLa 


5451 


GAGAGTGCTG 


ACCAAGTUxG 


AAlALLluuL 


a nn a p a t a nT 
AuuALAlAu X 


P A fSftTArtfiPJA 


5 501 


CACTACAATT 


O m m » f*f*f+*T**P^ 

CTTAGLLx lb 


a a a op & p,t & n 

AAAuLAulAU 


TGAAAGTAAA 


AAGAAATAAG 


C C C * 




p p a fiT P. T P P & 


PAfSATTA APA 


GAAGATAGAT 


GGAACAAGCC 


30U1 


/-»»T»/^/-» Jk * Jk X ft»p 

L. 1 uuAAAA 1 L. 


AuuVjALLAOW. 


t a rtrst^ a r a 


TTCAATGAAT 


GGACACTAGA 






OALiL, 1 UAAAu 


AAUAAUwiU 1 


AAGACATTTC 


CCTAGGCCTT 


C *7 ^ 




HTnTrinnf* a n 

v- 1 IJ X uLKjCAO 


TAPATTTATft 


AGACTTATGG-AGACACTTGG 


c •? C 1 

5751 


GAAGGAGTTA 


TGGGAAxTAT 


AAuAAlLl 1A 


CAACAACTAC 


TGTTTACCCA 


5801 


m«M m m « ^ % * mm 

TTATAGAATT 


GGATGCCAAC 


AIALjIAUAAx 


AfiRAATTPTP 


nriATrTAArTA 


5851 


CAAGAGGAAG 


AGGAAGAAGA 


AAlbuAILUA 


UlAuAlLLlw 


afSATRPPPPP 


5901 


TTGGCATCAC 


CCTGGGAGCA 




^^PTTPTH AT 

ULLlXuiAAi 


A A TTPY^T A TT 

AA1 iULlAl x 


5951 


GCAAAAGATG 


CTGCTATCAT 


TGCTATGTTT 


GTTTCACAAA 


GAAGGGTTTG 


6001 


GGAATCTCCC 


ATGGCAGGAA 


PA A PPPA AS? A 
(jAA ut vjAA OA 


AGACCAGCAG 


CTGCTGCAAG 


605 1 


CTATCCAGAT 


AAT AAAGAX U 


LlulALUnuA 


GCAGTAAGTA 


ACGCTGATGC 


6101 


ATCAAGAGAA 


CCTGCTAGCC 


TTAATAGCTT 


TAAGTGCTTT 


GTGTCTTATA 


6151 


AATGTACTTA 


TATGGTTGTT 


TAACCTTAGA 


ATTTATTTAG 


TGCAAAGAAA 


6201 


ACAAGATAGA 


AGGGAGCAGG 


AAATACTTGA 


AAGATTAAGG 


AGAATAAAGG 


6251 


AAATCAGGGA 


TGACAGTGAC 


TATGAAAGTA 


ATGAAGAAGA 


ACAACAGGAA 


6301 


GTCATGGAGC 


TTATACATAG 


CCATGGCTTT 


GCTAATCCCA 


TGTTTGAGTT 


6351 


ATAGTAAACA 


ATTGTATGCC 


ACAGTTTATT 


CTGGGGTACC 


TGTATGGGAA 


6401 


GAGGCAGCAC 


CAGTACTATT 


CTGTGCTTCA 


GATGCTAACC 


TAACAAGCAC 


6451 


TGAACAGCAT 


AATATTTGGG 


CATCACAAGC 


CTGCGTTCCT 


ACAGATCCCA 


6501 


ATCCACATGA 


ATTTCCACTA 


GGCAATGTGA 


CAGATAACTT 


TGATATATGG 


6551 


AAAAATTACA 


TGGTGGACCA 


AATGCATGAA 


GACATCATTA 


GTTTGTGGGA 


6601 


ACAGAGTTTA 


AAGCCTTGTG 


AGAAAATGAC 


TTTCTTATGT 


GTACAAATGA 
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6651 ACTGTGTAGA TCTGCAAACA AATAAAACAG GCCTATTAAA XGAGACAATA 

6701 AATGAGATGA GAAATTGTAG TTTTAATGTA ACTACAGTCC TCACAGACAA 

6751 AAAGGAGCAA AAACAGGCTC TATTCTATGT ATCAGATCTG AGTAAGGTTA 

6801 ATGACTCAAA TGCAGTAAAT GGAACAACAT ATATGTTAAC TAATTGTAAC 

6851 TCCACAATTA TCAAGCAGGC CTGTCCGAAG GTAAGTTTTG AGCCCATTCC 

6901 CATACACTAT TGTGCTCCAA CAGGATATGC CATCTTTAAG TGTAATGACA 

6951 CAGACTTTAA TGGAACAGGC CTATGCCACA ATATTTCAGT GGTTACTTGT 

7001 ACACATGGCA TCAAGCCAAC AGTAAGTACT CAACTAATAC TGAATGGGAC 

7051 ACTCTCTAGA GAAAAGATAA GAATTATGGG AAAAAATATT ACAGAATCAG 

7101 CAAAGAATAT CATAGTAACC CTAAACACTC CTATAAACAT GACCTGCATA 

7151 AGAGAAGGAA TTGCAGAGGT ACAAGATATA TATACAGGTC CAATGAGATG 

7201 GCGCAGTATG ACACTTAAAA GAAGTAACAA TACATCACCA AGATCAAGGG 

7251 TAGCTTATTG TACATATAAT AAGACTGTAT GGGAAAATGC CCTACAACAA 

7301 ACAGCTATAA GGTATTTAAA TCTTGTAAAC CAAACAGAGA ATGTTACCAT 

7351 AATATTCAGC AGAACTAGTG GTGGAGATGC AGAAGTAAGC CAITTACATT 

7401 TTAACTGTCA TGGAGAATTC TTTTATTGTA ACACATCTGG GATGTTTAAC 

7451 TATACTTTTA TCAACTGTAC AAAGTCCGGA TGCCAGGAGA TCAAAGGGAG 

7501 CAATGAGACC AATAAAAATG GTACTATACC TTGCAAGTTA AGACAGCTAG 

7551 XAAGATCATG GATGAAGGGA GAGTCGAGAA TCTATGCACC TCCCATCCCC 

7601 GGCAACTTAA CATGTCATTC CAACATAACT GGAATGATTC TACAGTTAGA 

7651 TCAACCATGG AATTCCACAG GTGAAAATAC ACTTAGACCA GTAGGGGGAG 

7701 ATATGAAAGA TATATGGAGA ACTAAATTGT ACAACTACAA AGTAGTACAG 

7751 ATAAAACCTT TTAGTGTAGC ACCTACAAAA ATGTCAAGAC CAATAATAAA 

7801 CATTCACACC CCTCACAGGG AAAAAAGAGC AGTAGGATTG GGAATGCTAT 

7851 TCTTGGGGGT GCTAAGTGCA GCAGGTAGCA CTATGGGCGC AGCGGCAACA 

7901 GCGCTGACGG TACGGACCCA CAGTGTACTG AAGGGTATAG TGCAACAGCA 

7951 GGACAACCTG CTGAGAGCGA TACAGGCCCA GCAACACTTG CTGAGGTTAT 



64 



EP 0 S91 914 A2 



8001 


CTGTATGGGG TATTAGACAA CTCCGAGCTC 


GCCTGCAAGC 


CTTAGAAACC 


8051 


CTTATACAGA 


ATCAGCAACG CCTAAACCTA 


TGGGGCTGTA AAGGAAAACT 


8101 


AATCTGTTAC 


ACATCAGTAA AATGGAACAC 


ATCATGGTCA GGAAGATATA 


8151 


ATGATGACAG 


TATTTGGGAC AACCTTACAT 


GGCAGCAATG 


GGACCAACAC 


8201 


ATAAACAATG 


TAAGCTCCAT TATATATGAT 


GAAATACAAG 


CAGCACAAGA 


8251 


CCAACAGGAA 


AAGAATGTAA AAGCATTGTT 


GGAGCTAGAT 


GAATGGGCCT 


8301 


CTCTTTGGAA 


TTGGTTTGAC ATAACTAAAT 


GGTTGTGGTA 


TATAAAAATA 


8351 


GCTATAATCA 


TAGTGGGAGC ACTAATAGGT 


ATAAGAGTTA 


TTATGATAAT 


8401 


ACTTAATCTA 


GTGAAGAACA TTAGGCAGGG 


ATATCAACCC 


CTCTCGTTGC 


8451 


AGATCCCTGT 


CCCACACCGG CAGGAAGCAG AAACGCCAGG 


AAGAACAGGA 


8501 


GAAGAAGGTG 


GAGAAGGAGA CAGGCCCAAG 


TGGACAGCCT 


TGCCACCAGG 


8551 


ATTCTTGCAA 


CAGTTGTACA CGGATCTCAG 


GACAATAATC 


TTGTGGACTT 


8601 


ACCACCTCTT 


GAGCAACTTA ATATCAGGGA 


TCCGGAGGCT 


GATCGACTAC 


8651 


CTGGGACTGG 


GACTGTGGAT CCTGGGACAA 


AAGACAATTG AAGCTTGTAG 


8701 


ACTTTGTGGA 


GCTGTAATGC AATATTGGCT 


ACAAGAATTG AAAAATAGTG 


8751 


CTACAAACCT 


GCTTGATACT AXTGCAGTGT 


CAGTTGCCAA 


TTGGACXGAC 


8801 


GGCATCATCT 


TAGGTCTACA AAGAATAGGA 


CAAGGATTCC 


TTCACATCCC 


8851 


AAGAAGAATT 


AGACAAGGTG CAGAAAGAAT 


CTTAGTGTAA 


CATGGGGAAT 


8901 


GCATGGAGCA 


AAAGCAAATT TGCAGGATGG 


TCAGAAGTAA 


GAGATAGAAT 


8951 


GAGACGATCC 


TCCTCTGATC CTCAACAACC 


ATGTGCACCT 


GGAGTAGGAG 


9001 


CTGTCTCCAG 


GGAGTTAGCA ACTAGAGGGG 


GAATATCAAG 


TTCCCACACT 


9051 


CCTCAAAACA 


ATGCAGCCCT TGCATTCCTA 


GACAGCCACA AAGATGAGGA 


9101 


TGTAGGCTTC 


CCAGTAAGAC CTCAAGTGCC 


TCTAAGGCCA 


ATGACCTTTA 


9151 


AAGCAGCCTT 


TGACCTCAGC TTCTTTTTAA 


AAGAAAAGGG 


AGGACTGGAT 


9201 


GGGTTAATTT 


ACTCCCATAA GAGAGCAGAA 


ATCCTGGATC 


TCTGGAXATA 


9251 


TCACACTCAG 


GGATTCTTCC CTGATTGGCA 


GTGTTACACA 


CCGGGACCAG 


9301 


GACCTAGATT 


CCCACTGACA TTTGGATGGT 


TGTTTAAACT 


GGTACCAGTG 
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9351 TCAGCAGAAG AGGCAGAGAG ACTGGGTAAT ACAAATGAAG ATGCTAGTCT 

9401 TCTACATCCA GCTTGTAAIC ATGGAGCTGA GGATGCACAC GGGGAGATAC 

9451 TAAAATGGCA GTTTGATAGA TCATTAGGCT TAACACATAT AGCCCTGCAA 

9501 AAGCACCCAG AGCTCTTCCC CAAGTAACTG ACACTGCGGG ACTTTCCAGA 

9551 CTGCTGACAC TGCGGGGACT TTCCAGCGTG GGAGGGATAA GGGGCGGTTC 

9601 GGGGAGTGGC TAACCCTCAG ATGCTGCATA TAAGCAGCTG CTTTCCGCTT 

9651 GTACCGGGTC TTAGTTAGAG GACCAGGTCT GAGCCCGGGA GCICCCTGGC 

9701 CTCTAGCTGA ACCCGCTGCT TAACGCTCAA TAAAGCTTGC CTTGAGTGAG 

9751 AAGCAGTGIG TGCTCATCTG TTCAACCCTG GTGTCTAGAG ATC 
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Fig. 6: obere Zeile entapricht Abb. 4, untere Zeile mit 
PCR-TechniJc ermittelt (Sequ. No. 57, 58) 

4 • • * • 

MvPS 1 8 0 685 AAACCTCCGACGCAACGGGCTCGGCTTAGCGGAGTGCACCTGCTAAGAGO 734 

iiiinii iiiiiiiiiiimiiiiiiiiiiiiiiiiiiiiiiiiiii sn 

1 aaacctccaacgcaacgggctcggcttagcggagtgcacctgctaagagg 

73 5 CGAGAGGAACTCACAAGAGGGTGAGTAAATTTGCTGGCGGTGGCCAGACC 784 

ill |i II 1 1 I MIIIIIIIIMM Mi ll IlilllllMIMIIIIII 

5 1 cgagaggaactcacaagagggtgagtaaatttgctggcggtggccagacc l 

785 TAGGGGAAGGGCGAAGTCCCTAGGGGAGGAAGATGGGTGCGAGAGCGTCT 834 

IMMIIIMIIIIIIIIIHIIMIIIIIIIIIIIIIIMIII Mil 

1 0 1 taggggaagggcgaagtccctaggggaggaagatgggtgcgagacggtct i a u 

835 GTGTTGACAGGGAGTAAATTGGATGCATGGGAACGAATTAGGTTAAGGCC 884 

IIIIIIIIIIIIIIIIMIIIMMIIIIIIIIIIIIMIIIIMIIIII _ 

1 5 1 gtgttgacagggagtaaattggatgcatgggaacgaattaggttaaggcc 200 

885 AGGATCTAAAAAGGCATATAGGCTAAAACATTTAGTATGGGCAAGCAGGG 934 

IMIIIIIIIIIIIIIIIIIIIIMMIIIIIIIIIIIIMIIIIIIIII _ 

201 aggatctaaaaaggcatataggctaaaAcatttagtatgggcaagcaggg 25 0 

9 3 5 AGCTGGAAAGATACGCATGTAATCCTGGTCTATTAGAAACTGCAGAAGGT 984 

llllllllllllllllll lllllillltlll IIIIIIIIMMIIIII _ 

251 agctggaaagatacgcatataatcctggtctactagaaactgcagaaggt 300 

985 ACTGAGCAACTGCTACAGCAGTTAGAGCCAGCTCTCAAGACAGGGTCAGA 103 4 

Mill IIIIIIIIIIIIIIIIIMIIIIIIIIIIIIIIIMIMIIIII _ 

3 0 1 ac tgaacaactgctacagcagttagagccagctctcaagacagggtcaga 350 

103 5 GGACCTGAAATCTCTCTGGAACGCAATAGCAGTACTCTGGTGCGTTCACA 1 08 4 

llllllllllll M I M 1 1 1 1 1 1! M ! I i 1 1 1 1 1 1 1 1 ! 1 1 M 1 1 1 ! 1 1 1 dnn 

3 5 1 ggacctgaaatccctctggaacgcaatagcagtactctggtgcgttcaca 400 

1 C 8 5 ACAGATTTGACATCCGAGATACACAGCAGGCAATACAAAAGTTAAAGGAA 113 4 

Mil Ml II II M Mill III II liilllll I II llllill HIM _ n 

4 01 acagatttgacatccgagatacacagcaggcaatacaaaagttaaaggaa 450 

• • • • • 

1135 GTAATGGCAAGCAGGAAGTCTGCAGAGGCCGCTAAGGAAGAAACAAGCCC 1184 

I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I crtA 

451 gtaatggcaagcaggaagtctgcagaggccgctaaggaagaaacaagctc 5 00 
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1 1 8 S TAGG ^ GACAAGTCA |^^ 1234 

5 o 1 aaggcaggcaagtcaaaattaccc tatagtaacaaatgcacagggacaaa 550 

1235 TGGTACATCAAGCCATCTCCCCCA^ 1 28 4 

551 tg^acatcaagccatatcccctaggact^ 600 

1 285 GTAC3AAGA<SAAG<3^ 13 34 

6 0 1 gtagaa^aaaggcctttaaccc tgaaattattcc tatgtttatggcatt g 5 0 

1335 AOTCAC3uAAG<3GGCTGTCZCCCT 1384 

651 itcagaaggggctgtcccctatgatatcaataccatgctgaatgccatag 700 

1385 G<5<3GAGACZCZ-AAGG<3GCT 1434 

7 0 1 ggggacaccaaggggc tttacaagtgttgaaggaagtaatcaatgaggaa 7 5 0 

1435 G<ZAGCAC3JCATG<3GA 1484 

7 5 1 gcagcagattgggatagaactcatccaccagcaatggggccgttaccacc a 00 

1 48 5 ^^^J j| GGG ^ 1534 

8 0 1 agggcaga taagggaaccaacaggaagtgacattgc tggaacaactagca 8 5 C 

153 5 ^^ GC ^|^j : ^ 1 584 

851 cacagcaagagcaaattatatggactactagaggggctaactctatccca 900 

1585 GTAGGAGACATCTATAGAAAAXGGAXAGXGCTAG^CT 1634 

901 g taggagacatc tatagaaaa t gga tagt gt taggac t aaacaaaa tggt 950 

1635 AAAAAXGTACAGTCCAGTGAGCAT C TTAOjkTAT^ 1684 

951 iiaaaUtacagU^ 1 000 
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1685 aac ^ ttca ^ ag | * 1734 

1001 aaccattcagagattatgtagatcggttttacaaaacattaagagctgag 1 oso 

1 735 CAAGCTACTCAAGAAGTAAAGAATTGGATG 1 78 4 

1051 caagctactcaagaagtaaagaattggatgacagaaaccctcgttgttca 1 1 00 

* • * 

1785 GJ^XXCAJUVCCCAClATYGTiL^U^ 1834 

1101 gaattcaaacccagattgtaaacaaattctgaaagcattaggaccaggag 1150 

• • • 

1835 CTACTTTAG ^^ 1 884 

-I ! 5 1 ctactttagaagaaatgatggtagcctgtcaaggagtaggagggccaact 2 qo 

1885 CACAAGGCLM^ 1934 

1 201 cacaaggcaaaaatactagcagaagcaatggcttctgcccagcaagattt 1 250 

• • * * 

1 9 35 AAAAGGAGGATAC j^ 1984 

1 251 aaagggaggatacacagcagtattcatgcaaagagggcagaatccaaata 1 300 

1985 GA; ^ GGGCGCATAAAAT ^^ 2034 

1301 ^iaagrecctataaaatgtttcaattgtggaaaagagggacatatagca 1350 

203 5 AAAAACTGTCGAGCACCTAGAAAAAGGGGTTGCT^ 2084 

1351 aaaaactgt^a^ 1 400 

2085 AGGTCACCAAATGAAAGATTGCAAAAAW^ 2134 

1401 aggtcaccaaatgaaaga ttgcaaaaa tggaagacaggc tatttttttag 1450 

2135 GGAAGTACTGGCCTCCGGGGGGCACGA^ 2184 

14 51 g^agtactggcctccggggggcacgaggccagccaattatgtgcagaaa ^ 50 o 
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2185 CAAGTGTCCCCAT^GCCCOVCCAATGGAG 2234 

1501 iiigtgtccccatcagccccaccaatggaggaggcagtgaaggaacaaga 1 550 

2235 <XAATCLAGAGTCAC5AA<3<5^ 228 4 

1551 gaa tcagaatcaaaaggggga tcagga 1600 

2285 TCAAATCCCTCTTTGGGAC^CUCC^TAG 2334 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 MM 1 1 1 1 1 1 1 N 1 1 1 II M 1 1 1 1 1 1 1 1 1 M 1 1 I 

1601 tcaaatccctc tt tgggacagaccaa tagtcacagcaaaggttgggggcc 1 6 5 0 

2335 ATCTATGTGAGGG 2384 

1651 atctatgt^ggctttactggatacaggggcagatgatacagtattaaat 1 700 

238 5 AACATAO^TTAG^GG^GA^ 2417 



1701 aacatacaat tagaaggaagatggacacccaaa 1 733 
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7: vergieicn aes gag-rrotexiia, bhuub* •— -■ - 
(jeweils oben) und einmal mit PCR-Technik (jeweils 
unten) ermittelt (Sequ. ID No. 56, 60) 

MGARASVLTGSKLDAWERIRLRPGSKK&YRLKHLVWA^ 
McJyffiSVLTGSKLDAWERIRLRPGSK 

LETAEGTEQLLQQLEPALKTGSEDLKSLWMAIAVLWCyHNRTOIRDTMA 
UlAEGTEQLLQQLEPALKTGSEDLKSLWHAIAVLWCVHlTOroiRDTQQA 

IQKLKEVl^RKSAEAA^ 



IQKLKEVMASRKSAE^^ 

NAWVKAVEEKAFNPEI IPMFMALSEGAVPYDINTML^IGGHQGAMyiiK 
NAVfVKAVEElCAFirPEI IPMFMALSEGAVPYDI5TMLNA 

EVINEEAAETORTHPPAMGPLPPGQIREPTGSDIAGWsiQQEQn 
EVINEEAADWDRTHPPAMGPLPPGQIREPTGSDIAGTTSTQQEQIIWTTR 

• • 

(^SIPVGDiYRKWIVLGUIKMVKHYSPVSIU)IRQGPraP^ 
CjUsiUGDIYRlWIVLGLHKMVmSPVSIU)IRQGPra 

KTLRAEQATQEVKSWMIETLLyQNSHPDCKQII^ 
KTxJ^QATQEVKNWITET^ 

GVGGPTHWVKIIAEAMASAQQDLKGGYTAVFMQRGQRP^KGPIKCWCG 
GVGGPTHKAKI LAEAMASAQQDLKGGYTAVFMQRGQNPHRKGP IKCFMCG 

, • • 

KEGHIAKNCRAPRKRGCWKCGQEGHQMKDCKNGRQANFLGKWPPGGIRP 
KEGH I AKICRAPRRRGYWKCGQEGHQMKDCKNGRO^PLGKW 

GNYVQKQVSPSAPPMEEAVKEQENQSQKGDQEELYPFASI^ 
AirlrVQKQVSPSAPPMEEAVKEQ 
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Fic. 8 
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